プログラム

125件の投稿

XLSTを使って整形

取り敢えず下のURLをクリックしてください。

https://hi-kaka.com/tmp/chibaTenki.xml

前回ご紹介した、気象庁のデータをダウンロードし、下に示すXSLTファイルを関連づけました。ブラウザはchibaTenki.xmlファイルをXSLTで整形して表示しています。

chibaTenki.xmlの修正は、2行目に次の文を追加しただけです。

<?xml-stylesheet type=”text/xsl” href=”./chibaTenki.xslt”?>

ブラウザだけでなく、大抵の言語、Php、Java、Javascript、Perl、.NETで、XMLをXLST変換して新たなXMLを作成することができます。

ここで、chibaTenki.xsltが問題のXSLTファイルです。

久しぶりに手探りでXSLTを作成したし、決して立派なものではありません。XSLTをご存知ない方に、「XSLTとはこんなものです」というくらいのサンプルです。

コードを簡単にご説明します。

<xsl:template match=”/weatherforecast/pref”>(8行目)では、XMLドキュメントの”/weatherforecast/pref”タグを探して、あったらprefタグの処理をします。

ここでしていることは、出力をHTMLタグで囲んで(9行目から16行目)、HTMLファイルのタイトルを「千葉県の天気」とし、出力bodyタグの中、<xsl:apply-templates select=”area”/>(14行目)で、「以下は<xsl:template match=”area”>に任せる」としています。

制御は<xsl:template match=”area”>(18行目)に移り、18から31行目の中でareaタグの処理をします。

続いて制御が<xsl:template match=”info”>(33行目)に移り、必要な処理をした後に、<xsl:call-template name=”RAIN”/>(58行目)でサブルーチン・テンプレートをコール、<xsl:template name=”RAIN”>(61行目)の中で、rainfallchanceタグの処理をします。

<?xml version="1.0" encoding="Shift_JIS"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output method="html" indent="yes"/>
 <xsl:variable name="prefecture" select="/weatherforecast/pref/@id"/>
 <xsl:template match="/weatherforecast/title|link|description|pubDate|author|managingEditor|">
  <xsl:text/>
 </xsl:template>
 <xsl:template match="/weatherforecast/pref">
  <html>
   <head>
    <title>千葉県の天気</title>
   </head>
   <body>
    <xsl:apply-templates select="area"/>
   </body>
  </html>
 </xsl:template>
 <xsl:template match="area">
  <table border="1" width="700">
   <tbody>
    <tr>
     <th>
      <xsl:value-of select="$prefecture"/>
      <xsl:text>   </xsl:text>
      <xsl:value-of select="@id"/>
      <xsl:apply-templates select="info" />
     </th>
    </tr>
   </tbody>
  </table>
 </xsl:template>
 
 <xsl:template match="info">
  <tr>
   <th>日時 <xsl:value-of select="@date"/>
   </th>
  </tr>
  <tr>   <td/>
   <td>
    <xsl:value-of select="weather"/>
   </td>
  </tr>
  <tr>   <td/>
   <td>    <xsl:value-of select="weather_detail"/>
   </td>
  </tr>
  <tr>   <td/>
   <td>    <table>     <tbody>
      <tr>       <td>        <xsl:text>気温  </xsl:text>       </td>
       <td>
        <xsl:value-of select="temperature/range[@centigrade='min']"/>
        <xsl:text> から </xsl:text>
        <xsl:value-of select="temperature/range[@centigrade='max']"/>
       </td>      
    </tr>
   </tbody>    </table>   </td>
  </tr>
  <xsl:call-template name="RAIN"/>
 </xsl:template>
 
 <xsl:template name="RAIN">
  <tr>   <td/>
   <td>    
  <table>     <tbody>
      <tr>       <td>
        <xsl:text>降水率  </xsl:text>
       </td>      </tr>
      <xsl:call-template name="RAINBYHOUR"/>
    </tbody>    </table>
   </td>  </tr>
 </xsl:template>
 <xsl:template name="RAINBYHOUR">
  <xsl:for-each select="rainfallchance/period">
   <xsl:sort select="@hour"/>
   <tr>    <td>
     <xsl:text>  </xsl:text>
     <xsl:value-of select="@hour"/>
     <xsl:text>  </xsl:text>
     <xsl:value-of select="."/>
     <xsl:text> % </xsl:text>
    </td>   </tr>
  </xsl:for-each>
 </xsl:template>
</xsl:stylesheet>

余談ですが、私は10年以上前に[XML Spy]というソフトを購入しました。
「使用権は永久」ということで安心していたのですが、今回これを引っ張り出して使おうとするとうまくいきません。

Altova社にメールしたら、私のライセンスは一度更新していて、最新の(といっても10年前の)ライセンス番号を送ってくれました。

というわけで、今回[XML Spy 2004]を使ってXLSTファイルを作成しました。

そんな訳で、上のXSLTファイルの2行目にstylesheet を宣言していますが、最新のXSLT2.0では、このstylesheet文を使わないことが推奨されているようです。

ここ数回に亘って、XMLについて少し整理しました。
XML処理の話はこれでおしまいです。

C#.NET XmlTextReader

前回のSAXと同じ仕事をする、XmlTextReaderを使ったコードをご紹介します。言語はC#、クラスの主要部分だけを抜き出しました。

  class MyXmlReader
  {

    private List<Area> o_lstArea = new List<Area>();

    public void XmlRead()
    {
      Area o_Area = null;
      Area.Info_data o_Info = null;

      Stack<String> elmNameStack = new Stack<String>();

      int rangCnt = 0;
      int periodCnt = 0;

      using (XmlReader reader = XmlTextReader.Create("http://www.drk7.jp/weather/xml/12.xml";))
      {
        while (reader.Read())
        {
          switch (reader.NodeType)
          {
            case XmlNodeType.Element:
              switch (reader.Name)
              {
                case "area":
                  o_Area = new Area();
                  o_Area.AreaName = reader.GetAttribute("id");

                  o_lstArea.Add(o_Area);
                  break;
                case "info":
                  o_Info = o_Area.makeInfo();
                  o_Info.Dt = reader.GetAttribute("date");
                  break;
                case "temperature":
                  rangCnt = 0;
                  break;
                case "rainfallchance":
                  periodCnt = 0;
                  break;
              }
              elmNameStack.Push(reader.Name);
              break;
            case XmlNodeType.Text:
              string elmName = elmNameStack.Pop();
              elmNameStack.Push(elmName);
              switch (elmName)
              {
                case "weather":
                  o_Info.Weather = reader.Value;
                  break;
                case "weather_detail":
                  o_Info.Weather_detail = reader.Value;
                  break;
                case "wave":
                  o_Info.Wave = reader.Value;
                  break;
                case "range":
                  o_Info.Range[rangCnt++] = Convert.ToInt32(reader.Value);
                  break;
                case "period":
                  o_Info.Rainfall[periodCnt++] = Convert.ToInt32(reader.Value);
                  break;
              }
              break;
            case XmlNodeType.EndElement:
              elmNameStack.Pop();
              break;
            }
          }
        }
      }

      public List<Area> getWeather()
      {
        return o_lstArea;
      }
    }
  }

前回と同じAreaクラスを使っていますし、やることもSAXと同じようなことをしています。

しかし、このクラスは何かのクラスを「継承していない」で、
XmlReaderを使っているだけです。

またSAXとXmlReaderの動作には大きな違いがあります。

SAXはElement(タグ)に「入った」と「出た」に対してイベントが発生するのにに対して、XmlReaderは、「Elementに入った」とか、「Textに入った」とか(他に沢山フラグが用意されています)、入った内容を知らせてきます(Elementから出たというフラグもあります)。

そして、気を付けてなければならないことはXmlReaderが読み込んで、「あ、要素だった」とか「あ、要素の内容(Text)だったか」とか分かるのですが、内容だったとき「何(タグ)の」内容なのかわからないのです。

そのために、Stackを使いました。

要素Elementに入った時に、要素名=タグ名をスタックにプッシュし、Elementから出るときにポップしています。

要素の内容(Text)が見つかった時に、スタックの一番上のタグ名を取り出し、タグ名を確認し、またプッシュしておきます。

そのほかは、前回のSAXと同じです。

XmlReaderはXMLドキュメントの特定の要素を直接読みに行く機能があるようで、もっと様々な使い方ができるのでしょうが、今の関心事は、これでおしまいです。

少なくとも、SAXの訳の分からないcharactersメソッドがないだけ、XmlReaderの方が気分的にはいいです。

Java SAX

初めてSAXを勉強したのでご紹介します。

例として、気象庁が提供している天気予報を使います。以下のURLをクリックしてください。向こう1週間の気象情報がXML形式で表示されます(下で表示されるのは、千葉県の情報です)。

http://www.drk7.jp/weather/xml/12.xml

一部をコピーします。

<weatherforecast>
<pref id="千葉県">
 <area id="北東部">
    <geo>
        <long>140.6877</long>
        <lat>35.7765</lat>
    </geo>
    <info date="2015/08/22">
        <weather>くもり</weather>
        <img>http://www.drk7.jp/MT/images/MTWeather/200.gif</img>
        <weather_detail>南の風 海上 では 南の風 やや強く 晴れ 夕方 から くもり</weather_detail>
        <wave>波 4メートル うねり を伴う</wave>
        <temperature unit="摂氏">
        <range centigrade="max">27</range>
        <range centigrade="min">24</range>
        </temperature>
        <rainfallchance unit="%">
        <period hour="00-06">20</period>
        <period hour="06-12">20</period>
        <period hour="12-18">20</period>
        <period hour="18-24">30</period>
        </rainfallchance>
    </info>
    

XMLとしては単純です。このXMLドキュメントから次のような形にして表示したいと思います。

  千葉県 北東部
    日時  2015/08/22
      天気  くもり
      天気詳細 南の風 海上 では 南の風 やや強く 晴れ 夕方 から くもり
      波 4メートル うねり を伴う
      気温 24 から27度
      降水確率 00-06 20%
           06-12 20%
           12-18 20%
           18-24 20%
    日時  2015/08/23
       天気  くもり時々晴れ
       天気詳細 北東の風 のち やや強く くもり 所により 夜 雨
       波 4メートル うねり を伴う
       気温 24から27度
       降水確率 00-06 20%
            06-12 20%
            12-18 20%
            18-24 20%
   ・・・・・

気象庁のXML情報(以下XMLドキュメントといいます)のルートタグは<weatherforecast>です。上のように表示するには、このXMLの内、areaタグとその下部要素のinfoタグが必要です。

千葉県の情報なので、prefタグは一つですが、areaタグは複数(3つ)、areaタグの下にも複数のinfoタグがあります。

infoタグの下には、weather、weather_detail、waveタグがあり、更に、複数のtemperatureタグとrainfallchanceタグがあります。

前回ご説明しましたが、SAXはXMLドキュメントを上から順に調べていきます。

調べた情報をどのような形で集めるか。

一番いいのはクラスを定義して、このクラスに情報を書き込んでいくのがいいと思います。SAXがXMLを調査していく過程で、必要な情報をクラスに書き込み、最終的にそのクラス(リスト)を取り出して、更に必要な処理をします。

ここで、クラスAreaを定義します。

Areaのメンバー変数は、AreaName、とInfoサブクラスです。

	public class Area {
		public ArrayList<Info_data> o_Infolst;
		public String AreaName;

		public  class Info_data {
			public String dt;
			public String weather;
			public String weather_detail;
			public int[] range = new int[2];
			public String wave;
			public int[] rainfall = new int[4];
		}
	}

上のクラス定義は概念的なものです。正確ではありません。

さて、JavaでSAXを処理するために、DefaultHandlerクラスがあります。ユーザはこのクラスを継承した独自クラスを定義し、このDefaultHandlerにXMLドキュメントの処理を委ねます。

DefaultHandlerの核心は、startElement、endElementイベントハンドラです。DefaultHandlerがXMLドキュメントを読み進んでいて、開始タグに出会うとstartElementイベントが起動され、終了タグに出会うとendElementイベントが起動します。

その時なにをするかは、プログラマが目的に沿って独自にコードを書きます。

DefaultHandlerにはもう一つ、重要なしかしよくわからないcharactersというメソッドがあります。

DefaultHandlerが要素の内容(Text)に出会うとその内容を取り出すようですが、あまり詳しい動作は分かりません。以下に今回の処理のために作成したSAXコードの主要部分を示します。

public class SAXHandler extends DefaultHandler {

    private ArrayList<Area> o_lstArea = new ArrayList<Area>();
    private Area o_Area;

    private List<Area.Info_data> o_Infos;
    private Area.Info_data o_Info;

    private int rangCnt;
    private int periodCnt;

    private String tempVal;

    public ArrayList<Area> getAllAreaWeather() {
        return o_lstArea;
    }

    @Override
    public void startElement(String nsURI, String strippedName, String tagName,
                             Attributes attributes)   throws SAXException {
        tempVal = "";
        if (strippedName.equalsIgnoreCase("area")) {
            o_Area = new Area();
            o_Area.setAreaName(attributes.getValue("id"));

            o_lstArea.add(o_Area);
        } else if (strippedName.equalsIgnoreCase("info")) {
            o_Info = o_Area.makeInfo();
            o_Info.setDt(attributes.getValue("date"));
        }  else if (strippedName.equalsIgnoreCase("temperature")) {
            rangCnt = 0;
        }  else if (strippedName.equalsIgnoreCase("rainfallchance")) {
            periodCnt = 0;
        }
    }

    @Override
    public void endElement(String name, String localName, String qName) {
        if (qName.equalsIgnoreCase("weather")) {
            o_Info.setWeather(tempVal);
        } else if (qName.equalsIgnoreCase("weather_detail")) {
            o_Info.setWeather_detail(tempVal);
        } else if (qName.equalsIgnoreCase("wave")) {
            o_Info.setWave(tempVal);
        } else if (qName.equalsIgnoreCase("range")) {
            o_Info.getRange()[rangCnt++] = Integer.parseInt(tempVal);
        } else if (qName.equalsIgnoreCase("period")) {
            o_Info.getRainfall()[periodCnt++] = Integer.parseInt(tempVal);
        }
    }

    @Override
    public void characters(char[] ch, int start, int length)
            throws SAXException {
            tempVal = new String(ch, start, length);
    }
}

上のコードで、[o_Area.setInfo]や[o_Info.setWeather_detail]等は上では省略したAreaクラスのメソッドです。

SAXHandlerのstartElementイベントでは、SAXがXMLの要素(ノード)を読んだときに新たな[Areaオブジェクト]を作ったり、Areaオブジェクトのサブオブジェクトを作成したり、温度や降水確率用の配列インデックスをクリアしたりしています。

一方のendElementイベントでは、要素の内容(Text)を読みこんだときに、その内容をAreaオブジェクトやInfoオブジェクトに書き込んでいます。

その書き込んでいる情報というのが、charactersで取得しているtempValです。

メインプログラムはSAXHandlerをコールし、SAXHandlerが作成したリスト変数[o_lstArea]を取得し、必要な処理を続けます。

 

ところで、WindowsプログラムではSAXを使いません。同等のクラスとしてXmlReaderがあります。

SAXでは、XMLドキュメントの処理をSAXHandler(DefaultHandler)が処理します。すなわち、処理はSAXHandlerの中に記述しますが、XmlReaderはXMLドキュメントを読み込むだけで、あとはコール側で処理プログラムを書きます。

同じようなものですが、XmlReaderにはcharactersのようなよくわからないメソッドはなく、すべて可視的なので、趣味の問題かもしれませんがXmlReaderの方が安心できます。

更に、Windowsにはデータ処理の手法として標準でLINQがあり、[LINQ to XML]はXML処理に関してはもっと簡単かもしれません。

次回は、XmlReaderではこの問題をどのようにコーディングするのか、ご紹介します。続いて、XSLTのご紹介もしたいと思います。

XML ドキュメントの処理

XMLというのは、言語仕様で、2000年ころからコンピュータ分野で広く採用されるようになりました。

単純な例を次に示します。

    <employees>
     	<employee id="101">
      		<firstName>Taro</firstName>
      		<lastName>Yamada</lastName>
    			・・・・・
     	</employee>
     	<employee id="102">
      		<firstName>Jiro</firstName>
      		<lastName>Suzuki</lastName>
    			・・・・・
     	</employee>
    		・・・・・
  </employees>

これは従業員名簿ですが、当然二人だけでなく沢山でいいし、項目も職種とか給与とか資格とか色々あるでしょう。階層も必要なだけ深くなっても構いません。

幾つか注意点があります。XMLファイル(ドキュメント)は、一つのルートを持つ木構造になっているということです。上の例では、木の根っこルートは<employees>です。一つのXMLドキュメントに複数のルートがあってはいけません。枝が絡み合ってもいけません。

幾つかのキーワードをご紹介します。
employees、employee 、firstName、lastName等はタグ(名)とわれ、タグは必ず開始タグと対応する終了タグがなければ以下ません。開始タグは[<]と[>]で囲まれ、終了タグは[< /]と[>]で囲われます。

上の例では、<employees>は開始タグ、</employees>は終了タグです。特殊な例としては、<employees id=”1″ firstName=”Hanako” />のように開始タグと終了タグが一つになることも有ります。

タグの中に書かれた上の例で、[id=”101″]は属性と言われます。

開始タグと終了タグで囲まれた部分を要素と言います。
上の例で、<firstName>Taro</firstName>は要素ですし、<employee id=”101″><firstName>Taro</firstName><lastName>Yamada</lastName></employee>は要素です。タグで囲まれた文字列は要素の内容と言います。TaroやYamadaやJiroやSuzukiは要素の内容です。

特に子要素をもつタグを節(ノード)と言います。木構造で枝分かれする付け根の部分=節に当たります。

 

ところで、上の例で「Jiro君の苗字は?」と聞かれて、「彼のの苗字はSuzuki」ですとすぐわかります。

これをコンピュータでどのように処理すればいいのか。という問題です。

現在二つの手法が提案されています(WindowsにはLINQ等専用の手法があります)。すなわち、SAXとDOMです。

SAXは、頑なにXMLドキュメントのルートから始まり、順に問いにたどり着こうとするものです。

上の例では、employees開始-> employee開始-> firstName開始->firstName終了->lastName開始->lastName終了-> ・・・・ ->employee終了

で最初のemployee検査を終了し、続いて次のemployeeの検査に進み、employee開始-> firstName開始「あ、見つかった」と必要な情報にたどり着き、あとはプログラムによって、色々な処理方法があると思います。今ここで重要なのは、SAXはこのように最初から順々に探していくということです。

一方のDOMは、ドキュメント全体を探し始めます。たとえば、firstNameタグを全部集めて、そこからJiroを探し出し、Jiro情報から直接lastNameタグのSuzukiを見つける方法です。

 

情報の抽出ではなく、XMLドキュメントを次の処理に扱いやすい新たなXMLドキュメントに変換する手法が、XLSTです。

Wordで単純な文章を作って、XML形式で書き出してみてください。驚ろくほど長文の複雑なXML形式の文章が出力されます。

一般にプログラムで機械的に出力されたXMLドキュメントは複雑な形をしています。扱いやすい形あるいは必要な形に成形してから、次の処理に回そうとか、そのままブラウザで表示しようとかのときは、XSLTはとても有効です。

個人的には、そのプログラミングはゲームやマジックを解くような感覚になり、とても楽しい作業です。

DOMやXSLTは10年以上前にやった経験がありますが、今はもうほとんど覚えていません。SAXはこれまでやったことがなかったし、興味があったので簡単な例で試してみました。

次回ご紹介します。

夏、Android始めました。

もう、私の人生でJavaを使うことはなかろうと、
Javaの参考書を処分することにしました。

嘗て、サーブレットやデザインパターンも一生懸命勉強したのですが、
Javaは基本的に大きなWEBシステムの開発には使うが、
Windowsの世界では使わないし、私が実務で使う機会はなかろう。

第一、私が持っている本は、古いものは15年も前のものだから、
「用済み」と考えました。

ベーシックな教科書を2,3冊残して、
参考書を「処分予定」として部屋の片隅に積んでおきました。

処分品をまとめて部屋の一か所に暫く積んでおくのが、
私流の断捨離の方法です。

そこを通りかかりながら、「やっはり取っておこう」と思わなければ、
最終的に処分します。
その期間は長いときには1年にもなりますが、それでもいいのです。

さて、そんなわけで、Java関連の本を10冊ばかり、
暫く積んでいました。

 

が、夏、「Androidをやろう」と気持ちを変えました。
Androidなら、個人でもプログラミングの機会があります。

積んでおいた本をもう一度見直しです。

5年くらい前に、
「Androidプログラミング入門」(ASCII 2010)を買って少しだけ 触ったのですが、
なんだかかったるくて、ほとんど何もやらないで終わっていました。

今回、大津真著「Javaからはじめよう  Andoroidプログラミング」(インプレス 2015/8/1)を買い、
参考プログラムを自分でも書きながら読んでみました。

この本は、最初Javaのおさらいがあって、
その後最新の[Android Studio]を使いながら、
基本的なAndroidのプログラミングをわかりやすく解説しています。

以前、Javaの開発環境はEclipseでしたが、
今はGoogleが無料で提供する[Android Studio]を、みなさん使っているようです。

 

少し、勉強したので、現時点での感想を書きます。

まず、開発環境[Android Studio](以下ASと書きます)はよくできていますが、
Microsoftの[Visual Studio](以下VSと言います)に比べると、今ひとつ生産性が悪いです。

アプリケーションの一つの画面に一つのクラスが対応していて、
ここに表示用のTextView(VSではTextBox)、Button等のウィジェット(VSではコントロール)を配置していくのは、ASもVSも同じですが、この先が違います。

VSでは、画面に配置されたコントロールの名前は画面クラスの中でそのまま使えるのですが、
ASではウィジェットにグローバルなIDをふり、
画面クラスではそのIDから該当するウィジェットを探し出してから、
値をセットしたり、イベントハンドラを定義したりします。

ある意味一寸したことですが、意外に煩わしい感じがします。

言語の問題では、Javaにコレクションが少ないのと、
構造体や列挙型がないのもプログラムの生産性を悪くしています。

画面同士の情報のやり取りも、面倒です。
まだ十分理解していませんが、インテントやサービスがAndroidの重要機能です。
この辺は、Android特有の考え方であり、煩わしい部分です。

1週間勉強すれば、概要は理解できると思います。