新辞林

ノイズが少ない日本語語義リストを探していた。

もちろんwikipediaでも良いのだが、もう少し基本的な語彙を含んでいるものがいい。

そこでCD-ROM付き辞典がいいのではと思い付いた。例えば、以下は良さそうだ。

このうちハイブリッド新辞林は出品者が信頼できそうだったので購入。

とりあえずはじめに、付録CD-ROMの指示通りにソフトをインストールしてみると、、、

20年以上前の製品でwindows95用と書いてあったので期待してなかったが、何の問題もなく見れた。

f:id:lang-int:20190409125418j:plain
新辞林(DTONIC)

なんだか感動。

そして、本題。

DTONIC Toolkitで形式の変更を試みる。

f:id:lang-int:20190409125454j:plain
Dtonic toolkit

右下の「パス1」を押して1分くらい待つと、無事"dtout.txt"というファイルが出力された。

これは辞書の内容がSGML形式に変換されたファイルらしい。

これでも読めなくなさそうだが、さらに「パス2」を押して待つ。今度はSGMLからHTMLへの変換だ。

図のファイルなどとともに"dtout.html"が出力された。

中には定義タグが大量に書かれている。表記の参考としていくつか引用する。

(新辞林 あ【唖】、あ【亜】)

<dt id="0100000300">あ【唖】</dt>
<dd>


話しことばが重度に障害され,ことばをまったく,あるいは,ほとんど発することができない状態。





<dt id="0100000400">あ【亜】</dt>
<dd>



[1]

(接頭)

<br>
  (1)…に次ぐ。

「―熱帯」

<br>
  (2)中心原子の酸化数が,基準となるものより小さいことを表す。

「―硫酸」

<br>
[2]

アジア(亜細亜)。

「東―」




いい感じだ。