年別アーカイブ: 2022年

3件の投稿

PDF教材をHTMLに変換する 2

「学校」にフリガナをつけると下のようになります。

学校 がっこう

手書きや、印刷では「学校」の文字の上に専用の小さいかなを付けているのでしょうが、
WEBではどのようになっているのでしょうか。

WEBでフリガナをつけるには次のような記号列が必要です。
(以下の文を仮にHTML文ということにします)。

<ruby> <rb>学校</rb> <rp>(</rp> <rt>がっこう</rt> <rp>)</rp> </ruby>

これをブラウザ(Micosoft EgeとかChrome)が解釈して、上のように「学校」の上にルビをつけます。

上のHTML文で「(」と「)」で囲まれた部分は、ブラウザが正しくルビが付けられなかったとき、
かっこでかなをつけることになります。

 

さて、教材でカナが付けられたているところは、
全部上のようなHTML文にしなければいけません。

続きを読む

最近のプログラミング言語

前回、
インターネット画面で漢字にルビを付けるプログラムについてご紹介して、
核心的な部分の話を書かないまま1カ月程度経過しました。

今回、久しぶりにプログラムを書いて、
「えー、ソフトの世界は最近はこーなっているの」のような疑問・興味がわいてきて、
その解明・勉強に脱線しています。

今回のプログラムでは、jQueryとBootstrapを必要なところだけ学習しました。
これらはJavascriptのプラグインあるいはライブラリーのようなものです。

Javascriptは昔一度手伝い仕事で使ったことがありますが、
ほんのチョットかじっただけです。

私はJavascriptが好きではなく、まあこんのものかと思っていたら、
実はこの言語はどんどん進化していて、
プログラミング言語としての人気も不動の上位を譲らないようです。

jQueryやBootstrapの人気もJavascriptの人気を押し上げているのでしょう。

私がJavascriptが好きでないのは、
何か「だらだらと、あれもかけるこれも書ける」というような言語仕様になっているところです。

型宣言がないのでユーザとしては相当いい加減なプログラムが書ける。
変数に関数を代入でき、変数をコールすればすなわち関数コールになるなど、
便利といえば便利でしょうが、私としては気持ち悪いのです。
(Cでも変数に関数のアドレスを代入すれば、同様のことはできます。)

続きを読む

PDF教材をHTMLに変換する 1

長い間プログラムを書いていなかったのですが、
児童用のPDF教材をWEB用に書き換える手伝い仕事で、
短いプログラムを書きました。

 

PDFをそのままWEB画面に貼り付けるのではなく、
内容はそのままに、新たにWEBのサイトを作るのです。

与えられた材料は、PDFファイルだけです。

主な作業は次のようなものです。

① PDFから文字と画像を取り出す。

② 画像と文字をHTMLファイルに書き込む。

③ 一部の漢字にはルビを振り、
PDFと同じようなレイアウトをし、
ボタンを押すと動画を表示するようにする。

 

そもそもPDFがあるということは、
恐らく、アドビ・イラストレータかInDesignを使っているのでしょうから、
電子データがあるのでしょう。
ということは、その電子データから直接画像なり、文章なりを抽出すれば、
全く簡単で正確な情報が得られるのに、どうしてこうなったのでしょうか。
著作権が問題だったのでしょうか。

 

まず①の仕事。
当然、手作業で書き写すわけにはいきません。

画像と文字を抽出するのに、
無料のソフト、確か画像抽出ではPDFTools、文字抽出にはABBYY FineReaderを使いました。

私は、古いAdobe Acrobatを持っていますので試したのですが、
これより上記のソフトの方がよく働いてくれました。

続きを読む