日本語Wikipediaの全本文をWebから利用できるようにした。
Javascript経由でブラウザから、データを受け取り、phpで、prologサーバーにアクセスし、prologサーバーがwikipediaの二分木データにアクセスし、回答すると言う手順になっている。
prologサーバーがメモリ上に展開し、wikipediaの二分木を咥え込むと、26Gバイトくらいになるので、VPSでは対応できないので、このサーバーだけ、自宅のPCにおいて、そこにアクセスするようになっている。自宅PCは、メモリを64G積んでいるので、なんとか対応できる。大学のPCも16Gなので、メモリエラーになってしまうのだ。
だから、自宅PCでサーバーを動かしている時しか検索できない。問い合わせいただければ、動かす時間をお知らせすることができる。
これで、prologでやろうとしたことの1クールが終わったことになる。
次は、twitterデータを使って、話し言葉でこれに対応してみたい。そして、もっと人間の言葉、日本語の言葉の知能的処理に挑戦したいと思っている。