トモロログ

仕事や趣味でのメモや記録など

全文検索DB

先日 mroongaのセミ

Groonga - 「MySQLとPostgreSQLと日本語全文検索3」開催のお知らせ

に参加。ここで知ったのがmysql5.7からmysqlでもインデックスを使った全文検索

が可能ということ。そして google cloud sql の2nd のバージョンが5.7になっていた。

 

とりあえず公報データを投入して試したら検索できた。ただ気になるのは以下。

 

  • mecabトークナイザは使えなさそう(mysql では使えるけどgoogleでは使えないという意味で)。インストールできないしね。基本はbi-gram
  • innoDB エンジンだとmroongaに比べると遅い。トランザクションはいらないので高速であればよいのだが。
  • mroongaは他テーブルの参照にベクターカラムを持てるのだがそれは使えない。この機能は便利そうなのだが。詳しくはこちら

 

 とはいえ、google cloud sql が使えたらサーバー設定も管理も楽なので速度さえでればというところ。まずは数万件データを入れてから速度を見てみようかなと。無駄にならなければよいが。。