Social IME ~ みんなで育てる日本語入力 ~

今までのIMEとどう違うの?

今までのIMEとSocial IMEの違い

Social IMEはユーザー参加型の日本語入力システムです。上の図のように、今までのIMEは1人のユーザーが1つのPCの中で使うものであったのに対し、 Social IMEではたくさんのユーザーがインターネットを通してサーバー側のシステムを使う、という違いがあります。 Social IMEではインターネットのメリットを最大限に活用することで、今までのIMEにあった次のような問題点を解決できます。

今までのIMEにはこんな問題点があった!

今までのIMEは、インターネットが普及する前の時代につくられたため、オフラインの状態を前提に動作していました。 そのため、単語の辞書や使用頻度などの変換に使用されるデータは、ローカルのPCに保存されます。 しかし、そのような方式のIMEでは3つの問題点があります。

1. デフォルトの辞書に入っていない専門用語や流行語を変換できないという問題点。

変換できない単語は自分で登録する必要があります。 このことが入力効率を低下させ、ユーザーの負担となっていました。 しかも、日本中でたくさんの人が別のPCに同じ単語を登録するという大きな無駄が発生していました。

2. 変換に使用する単語の使用頻度などのデータが足りず、誤変換が起きるという問題点。

単語の使用頻度などのデータは、基本的にインストールした時点のものがそのまま使われます。 変換に使用されるデータは、正しい日本語とは何か、という知識と開発者の感覚から職人芸的に作られていました。 しかし事前に用意されたデータが少ないため、精度の高い変換が困難でした。 そもそもかな漢字変換や予測変換は、使用頻度の高い単語やフレーズを候補とするため、大量のデータを必要とします。 今までのIMEは、事前に用意された少数のデータに基づいて変換を行うため、精度の向上に限界が生じていました。

3. 使用できるメモリーなどのリソースが少ないという問題点。

上述のように、かな漢字変換や予測変換は非常に多くのデータを扱うため、多くのメモリーを必要とします。 しかし、IMEはPCに常駐するソフトウェアであるため、多くのメモリーを消費することは好まれません。 同様にCPUの計算時間やハードディスクの容量にも厳しい制限がありました。 今までのIMEは、このように厳しい制約の中で開発されてきました。

Social IMEはどうして便利なのか

今までのIMEに対して、Social IMEはインターネットを通してたくさんの人が使うユーザー参加型のシステムです。 Social IMEではインターネットのメリットを最大限に活用するために、サーバー側で変換を行います。 インターネットを活用するメリットとは、次のような3つのメリットのことです。

1. ユーザーが登録した単語を共有することで、専門用語や流行語などの単語が変換できる

ユーザーが登録した単語をサーバー側で共有することができます。 これにより、専門用語や流行語などの、普通では変換できない単語を変換することができるようになります。 たくさんの人が別のPCに同じ単語を登録する無駄がなくなるので、単語登録の手間が省けるようになります。 また、データのバックアップや複数のPCでデータを同期する必要がなくなります。

2. Webページ上の文章から統計量を抽出し、変換に用いることができる

インターネットを用いる利点は、ユーザー同士でデータを共有できるというだけではありません。 現在Web上には1兆を超えるWebページがあるといわれ、その1割程度が日本語で記述されています。 このように膨大なWebページに含まれる日本語の文章から、単語の使用頻度などの統計量を抽出することで、変換に用いることができます。 そもそも日本語入力においては、同音異義語が複数ある場合や、単語の境界が曖昧な場合に、変換結果を一意に決めることができないという問題があります。 予測変換では、読みが入力されていない部分を予測するため、特に曖昧性が高いといえます。 上述のような大規模な統計量を用いると、使用頻度の高い文章表現をデータベースの中から検索することができます。 これにより、変換候補の中から適切な候補を選択し、日本語入力における曖昧性を解決することができます。

3. サーバーサイドの豊富なハードウェアリソースを利用できる

上述のような大規模なデータをクライアントPCに直接インストールし、常にメモリー上にロードして使用することは現実的ではありません。 それに対し、専用のサーバーでデータを扱うことで、メモリーやハードディスクの容量などのハードウェアリソースを豊富に使うことができます。 また、サーバーを複数台用意することで、より多くのデータを扱うことができると考えられます。

結論

このように、今までのIMEはインターネットが普及する前の時代につくられたため、いろいろな問題点がありました。 Social IMEではインターネットを活かしてユーザー参加型にすることで、これらの問題点を解決することができるようになります。