[Google 日本語入力チームのソフトウェアエンジニア小松弘幸から Google 日本語入力のベータ版卒業、正式版リリースについて寄稿を頂きました。-山崎]

早いもので今年もあと少しとなりました。みなさんにとって 2010 年はどのような年だったでしょうか?

本日、Google 日本語入力 がベータ版を卒業して正式版になったことをお知らせします。Google 日本語入力 チームは、2009 年 12 月 3 日に最初のベータ版をリリースして以来、みなさんのフィードバックに支えられながら、変換精度の向上やさまざまな機能の追加を継続してきました。今後も Google 日本語入力 をさらにより良くしていきますので、どうぞご期待ください。




バージョン番号は以下のように更新されます。既にベータ版をお使いの場合は自動的に更新されますので、そのままお待ちください。

Windows 版: 0.14.541.0 → 1.0.556.0
Mac 版: 0.14.541.1 → 1.0.556.1

また、開発版とオープンソース版も、以下のように更新されています。

Windows 版: 0.14.543.100 → 1.0.558.100
Mac 版: 0.14.543.101 → 1.0.558.101
オープンソース版: 0.13.523.102 → 1.0.558.102

前回のバージョンにくらべて、アプリケーションの安定性が向上しています。


Google 日本語入力 には、「豊富な語彙」「サジェスト入力」「さまざまな特殊変換機能」などの特徴があります。あらためて、これらの特徴をご紹介します。

豊富な語彙

Google 日本語入力 の単語辞書は、インターネット上に公開されているウェブページなどの膨大な情報をもとに作成されています。そのため、一般的な単語辞書には含まれていない、固有名詞や専門用語なども広く網羅しています。これはウェブ検索の技術を活用しており、まさに Google ならではの手法です。

例えば、以下のような単語が辞書に含まれています。
  • ノルウェイの森
  • 子ども手当
  • 牽牛子塚古墳(けんごしづかこふん)
  • 次亜塩素酸ナトリウム
  • 武市半平太(たけちはんぺいた)
  • 超電磁砲(れーるがん)

サジェスト入力

携帯電話の予測入力や、Google 検索でのサジェスト機能など、数文字入力するだけで目的の文章が入力できる機能は、いろいろな場面で使われています。Google 日本語入力は、このサジェスト入力機能を最大限活用できるように作られています。例えば、「よろしくお願いします」を何度か入力すると、最初の「よ」を入力するだけで、「よろしくお願いします」が入力できるようになります。

このサジェスト入力機能は、リリース当時からサポートされていましたが、みなさんのフィードバックをもとに、変換精度も使い勝手も大きく向上しています。


さまざまな特殊変換機能

Google 日本語入力には、顔文字や郵便番号など、さまざまな特殊変換機能を搭載しています。どれも「かゆいところに手が届く」機能だと思いますので、ぜひ活用してください。

顔文字 & 記号入力
「かおもじ」や「にこにこ」、「きごう」や「はーと」などの読みで、顔文字や記号を入力できます。
例: (^^) m(_ _)m (`・ω・´)シャキーン Σ(゚д゚lll)ガーン ♡ (はーと) ☃ (ゆきだるま) ↺ ♞ ♬ ㊷

郵便番号
郵便番号を入力すると、該当する住所が入力できます。
例: 106-0032 → 東京都港区六本木

英単語変換
日本語のよみから、英単語を入力できます。
例: よっと → yacht あんどろいど → Android

日付・年号
「きょう」「あした」「げつようび」などで「2010年12月10日」「2010/12/13」といった日付が、「いま」「じこく」で「17:46」「午後5時46分」といった時間が、「らいねん」「645ねん」で「2011年」「大化元年」といった年号が入力できます。

もしかして?
Google 検索の「もしかして?」のように、単語の修正をします。
例: あぼがど → アボカド しゅみれーしょん → シミュレーション

計算機
Google 日本語入力は計算機にもなります :)
例: (10+4)*3= → 42

2 進数・ 16 進数変換
ちょっとエンジニア向けの機能ですが、コンピュータ上でよく使われる、特殊な数字の表現方法にも変換できます。
例: 42 → 0b101010, 256 → 0x100

z コマンド
「ka」で「か」とローマ字入力する要領で、「zl」で「→」、「z.」で「…」など、「 z+一文字」で、よく使う記号を入力できます。以下の 10 種類コマンドがあります。

(zh zj zk zl) → (← ↓ ↑ →)
(z[ z]) → (『 』)
(z, z. z/ z-) → (‥ … ・ 〜)


その他のリリース時からの変更点

上記のような特徴的な機能だけでなく、変換精度や動作速度や安定性という、日本語入力ソフトウェアにとってもっとも重要な点についても、しっかりと取り組んできました。最初のリリースからの変更点をご紹介します。

変換精度の向上

変換アルゴリズムや辞書の自動生成アルゴリズム、サジェスト入力の精度などを向上など、あらゆる点での変換精度を向上させました。具体的には以下のようなものがあります。

口語表現への対応
例: 「行ってきまーす」「知りたーい」など変換できるようになりました。

誤用の抑制
例: 「的を得る」「危機一発」などがサジェストされないようになりました。

辞書の自動生成アルゴリズムの向上
例: 「読み」の推定間違いの削減(「ないか → 奈良県」などの読み間違い)
例: 当て字読みへの対応(「とも→強敵」など)

サジェスト入力の変換精度
例: 「東京」を確定後、「た」と入力すると「タワー」がサジェストされる
例: 「よろしく」と「お願いします」と続けて確定すると、「よろしくお願いします」がまとめてサジェストされる。



動作速度の向上

動作速度も、リリース以来、着実に改善を重ねていきました。特に Windows 版では、辞書をメモリ上に置く、実装方法を変更するなどの手法によって、劇的に向上しました。(実装方法は TSF から IMM32 へ変更しました。)

また、単語辞書の圧縮方法も向上しており、リリース時とファイルサイズは大きく変わっていないにも関わらず、収録語彙数はさらに増加しています。


対応アプリケーションの増加

リリース当初には、Google 日本語入力 と相性のよくないアプリケーションがいくつかありました。ヘルプフォーラムでのみなさんのフィードバックを元に、着実に問題の分析と解決を進めていきました。また、Windows 版では、前述のとおり実装方法を変更することによって、相性問題に対して大きく前進することができました。リリース当初と比べて、ゲームや日本語入力の機能を活用するアプリケーションとの相性が大きく改善されました。


Google 日本語入力 を正式版としてリリースできることを、非常にうれしく思います。しかし一方で、またまだ足りていない機能は残っていますし、まだお見せできていない新しいコンセプトの機能を早く紹介したいとも考えています。これまで以上に、Google 日本語入力 は「思いどおりの日本語入力」を実現するべく開発を続けていきますので、今後ともどうぞ応援をよろしくお願いします。