オブジェクトの広場はオージス総研グループのエンジニアによる技術発表サイトです

2019
3
月号

まだ寒い日もありますが桜の開花を喜ぶ声が届くようになりました。もう春ですね。今月から新しく自然言語処理に関する連載が始まります。今月もオブジェクトの広場をどうぞお楽しみください。(2019.03.26)

はじめての自然言語処理 第1回 類似文書検索の手法と精度比較

自然言語処理とは、人間が自然に使っている英語や日本語などの言語をコンピュータで処理する技術です。自然言語処理でできることには機械翻訳、要約生成、感情分析などがありますが、今回は比較的シンプルな例として類似文書検索に焦点を当ててみたいと思います。類似文書検索はテーマとしては真新しいものではありませんが、本記事では単語の分散表現を用いる手法や Watson Discovery も含めた各種の類似文書検索手法について、日本語データに対して精度比較試験をした結果を紹介します。複数の手法を同一の日本語データで比較した記事はあまり見ないので面白いのではないでしょうか。

4月号は、4月中旬頃の公開予定です。

From Editors
小学1年生から開始したピアノの習い事。周りのお友達全員は毎年ピアノの発表会に出るのですが、うちの娘は頑なに拒否。ですが、4年生間近になって自ら「発表会に出ようかな」という発言が!昨年12月に発表会のパンフレットの絵を描き、発表会を家族3人で鑑賞したことがきっかけだと思います。北風と太陽のお話のように、太陽な接し方で関わることが大事だなと思った出来事でした。(ひろやす)