2012 / 1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
20年間の経験と実績を誇る日本語処理システムのパイオニア
言語工学研究所 国分芳宏

2012

January

29

日記:: 転んで顔を打ってしまいました。
コメント 0 / 0

 昨日転んで目の上を打って今顔がおいわさん状態です。
 みんなに酔っ払ってと先に言われました。

 転んだときに手をついたのでが、反応が遅くて顔で受け止めてしまいました。




2012

January

18

日記:: 良しあし
コメント 0 / 0

記事の内容が推奨か非推奨かを示す言葉としてこれまで「良しあし」という言葉を使ってきました。

なじみやすい言葉なのですが、この言葉は文章の間違いがあるかないかという意味に取られてしまいそうです。
「ポジネガ」という言葉も考えたのですが推奨か非推奨とは直接関係がないように見えます。
「推奨」「誹謗」という言葉を使ったこともあるのですが「誹謗」という言葉が強すぎるようです。
何かよい言葉の組み合わせはないでしょうか。

どなたかご教示ください。




2012

January

05

日記:: きづな
コメント 0 / 0
我々の辞書には「きづな」は、誤りを正しい表記に直すための項目として登録してありました。今朝、この表記自体も正しい表記にしました。いつまで正しい表記にしておく必要があるのでしょうか。



2012

January

03

日記:: 上手な出頭のしかた。
コメント 0 / 0

今回の平田信の出頭のようなトラブルを避けるために警視庁では上手な出頭のしかたというマニュアルを作ることになりました。

 




2011

December

30

日記:: 良い年をお迎えください、
コメント 0 / 0
お正月のためにお酒を買ってきました。もうお正月の準備は全部できました。
いつも6時になると飲み始めるのですが、休みになると6時まで我慢するのが大変です。
もうすぐ会社に行かなくてもよいようになったら、毎日どうやって過ごせばいいのでしょうか。
心配です。



2011

December

29

日記:: 救命胴衣
コメント 0 / 0
海のそばの家には津波対策のために、住んでいる人数分の救命胴衣を全戸に備えておくべきです。津波で流されても生存する可能性が大幅に高くなるでしょう。津波警報がでて、高台に逃げるときも、救命胴衣つけたまま逃げればより安全です。



日記:: 高台移転
コメント 0 / 0
今回の地震は1000年に一度の大地震だそうである。ということは、あと900年以上はこんなに大きな地震は来ないということです。地震の原因が地殻プレートの摩擦という説明でも、エネルギーが解放されたということなので少なくとも500年はないだろう。普通の住居は500年持つとは思えない。500年ぐらいは今の場所に住居を作って500年ぐらい経ったら高台移転すれば十分ではないだろうか。



2011

December

27

日記:: よいお年をお迎えください。
コメント 0 / 0

毎朝ツイッターとフェースブックで「株式市場」をキーワードにしてツイッタライザーで評判分析の結果を投稿していました。

明日からしばらく、ツイッタライザーによる「株式市場」の評判分析を休止します。
ポックリ逝ったのではないかと思わないでください。

正月は酒びたりになりそうなので。それに東証も休みですから。
来年からは「株式市場 東京」でチェックします。
「株式市場」だけだとニューヨークの影響を受けてツイッタライザーの分析と違ってしまうような気がするので。




2011

December

26

日記:: 小石川後楽園に行ってきました。
コメント 0 / 0

すいていました。まだ、何本か散り残った紅葉がありました。正月も紅葉が見られそうです。花は椿が何本か咲いていましたが、それ以外はありませんでした。




2011

December

19

日記:: かわいい
コメント 0 / 0
若い女性に私の持ち物を「かわいい」とほめられました。我々の世代では、「かわいい」という言葉は小さな子供にしか使わない言葉でした。この言葉は世界的にはやっているそうです。韓国語でも小さな子供に使う「かわいい」の意味の言葉はあるのだそうですが、日本語の「かわいい」のように全てに使える言葉がないそうです。そのためか日本語の「かわいい」が使われているそうです。ギャル語は、同じ言葉でも意味が違っているようです。



2011

December

14

日記:: ヒッグス粒子
コメント 0 / 0

ヒッグス粒子の存在を証明できるかもしれないというニュースがありました。

言語工学研究所のシソーラスにはすでに登録してあります。




2011

December

10

日記:: 月食
コメント 0 / 0

11年ぶりの月食だそうで、次の月食はいつだろう。

これが今生最後の月食かもしれないので、遅くまで起きて見ました。

 




2011

December

07

日記:: 小石川後楽園
コメント 0 / 0

小石川後楽園に行ってきました。ちょうど紅葉が見頃です。今日は風もないので水に映って綺麗でした.

人生も秋の私の同輩が大勢いました。ぜひ行ってみてください。




2011

December

06

日記:: 色事
コメント 0 / 0

ツイッタライザーで良しあしを色を付けて表示しています。これまで良いが青で、悪いが赤で表示していました。これは交通信号に合わせたものです。それを先日私の意見で逆にして良いを赤、悪いを青にしました。青というと、気分がブルーだとか、マリッジ・ブルーなどという言葉があって青は沈んだ気分の色だと考えたためです。NHKの株価情報なども、値上がりした時は上矢印が赤系統の色で、逆に値下がりしたときは青系統の色で表示しています。

皆さんはどう思われますか。

 




2011

November

27

日記:: ハンドバック
コメント 0 / 0

カバン屋の看板に「ハンドバック」と書いてありました。早く直さないと手が後ろに回るぞ。




2011

November

22

日記:: 午前中会社をさぼって高尾山に行ってきました。
コメント 0 / 0

頂上は紅葉していましたが、麓はまだで紅葉するまでにあと半月ぐらいかかりそうでした。麓から歩いて登りました。天気も良くて久しぶりで心地よい汗をかきました。17,000歩、歩きました。




2011

November

19

日記:: 老人の会合
コメント 0 / 0
久しぶりで高等学校のクラブの会合がありました。最初12人が出席するという話しだったのですが、おそらく二、三人は欠席者いるだろうと思って10人分の席を予約しておきました。しかし、欠席者は一人もいなくて、全員が集まりました。この連中は他に遊んでくれるひとがいないのでしょう。



2011

November

18

日記:: ホームページを大修正しました。
コメント 0 / 0

始めて以来の大修正です。

でも、こんな。ものです。ぜひご覧になってください。

何かご意見はありませんでしょうか。

ホームページ http://www.gengokk.co.jp/




2011

November

04

日記:: 寝たきり老人
コメント 0 / 0
昨日は一日一人だったので、寝たきり老人をやりました。
一昨日の晩まではどこか魚のおいしいところへ、食べに行こうと思っていたのですが。
今日は少しすっきりしています。



2011

October

21

日記:: ギャル語
コメント 0 / 0
ツイッタライザーで、ツイッターの記事を解析する必要上「ギャル語」も採択しています。ネットで調べるとスゴイ量がみつかりました。できればよく使われるギャル語を中心に100語ぐらいを採択したいのですが。逆に女子高生はこんなに数多くの言葉を知っているのでしょうか。



2011

October

18

日記:: 調味料
コメント 0 / 0

料理のレシピを見ると調味料にお酒が書いてあります。我がシソーラスではお酒は調味料に分類していません。お酒はそれだけで飲むもので、調味料として料理にいれたらもったいない。だいいち調味料にお酒が入っていても、いなくても私の舌では分かりません。




2011

October

06

日記:: シンボリルドルフ
コメント 0 / 0
昨日のスポーツ新聞にシンボリルドルフが死んだという記事が一面トップで載っていました。私が死んでも何にもでないでしょう。でも考えてみると、彼の方が稼ぎがよかったからしょうがないか。



2011

October

04

日記:: 彼岸花
コメント 0 / 0
後楽園に行ってきました。今年の秋は暑さが続いたあと急に寒くなって体調を壊してしまいましたが。丁度彼岸花が満開でした。彼岸花は温度ではなくて、日の長さで花を咲かせるのでしょう。



2011

September

23

日記:: ~過ぎる
コメント 0 / 0

テレビを見ていて芦田愛菜ちゃんが可愛過ぎたので、「愛菜」を辞書に登録しました。

「広過ぎる」「高過ぎる」などは「過ぎる」の関係で、普通悪い意味ですが、「可愛過ぎる」は良い意味です。




2011

September

21

日記:: 帰宅難民
コメント 0 / 0
台風で震災以来、半年ぶりで事務所に泊まることになりました。部屋の中にいたので外の状況がわかりませんでした。
震災の時はたまたまつまみがあったのですが今回はありません。アナログのテレビも映りません。
前回はツイッターに感激しました。
また飲み明かすことになりますが、さきほど夕飯を済ませたので。何も心配はありません。気候も良いので下着だけで過ごしています。



2011

August

31

日記:: 全員野球
コメント 0 / 0

民主党の代表選挙でほとんどの候補者が「全員野球」という言葉を使っていました。あまり意味の分からない言葉で要するに「挙党態勢」といいたかったのでしょう。

ツイッタライザーによる評価では。

「全員野球」良い26、悪い46。

「挙党態勢」良い59、悪い24。

「オフサイド」良い35、悪い28。




2011

August

11

日記:: 評判の時間による変化
コメント 0 / 0

「株式市場」をキーに評判の変化を調べました。

ここ数日は米ドルの格付けが下がったという問題で変動が大きかったので面白い変化をしていました。

 
 8月 8日 良い16% 悪い69%
 8月 9日 良い39% 悪い57%
 8月10日 良い69% 悪い30%
 8月11日 良い22% 悪い65%
どなたかその前日の株式相場と比較してみてくださいませんか。

他にも何か面白そうなキーを見つけてやってみてください。

ツイッタライザー http://www.twitterlyzer.jp/

 


 




2011

August

05

日記:: ツイッターライザーの改良
コメント 0 / 0

ツイッターライザーの検索結果に良しあしのパーセント表示を付けました。皆さんの身近なもの同士の良しあしを比較してみてください。画面の色も大幅にかわり、交通信号と同じに赤が悪い、青が良いにしました。チェックも早くなりましたので遊んでみてください。

    http://www.twitterlyzer.jp/

 

検索は複数の用語を空白で挟んで指定できます。「アンド」に意味になります。

例えば「マヨネーズ キューピー」と「マヨネーズ 味の素」で比較してみてください。





2011

August

01

日記:: ゴーヤがなり始めました。
コメント 0 / 0

我が家もグリーンカーテンのゴーヤがなり始めました。近所の家でもなっています。今のところ毎日食べていますが、直ぐに飽きるでしょう。

 




2011

July

21

日記:: ツイッターライザーを皆さんに使ってもらえるようにしました。
コメント 0 / 0

    http://www.twitterlyzer.jp/

まだまだ改良の余地があると思っています。ぜひ使ってみてご感想をお聞かせください。




2011

July

14

日記:: 博物館入り
コメント 0 / 0

 暑いので冷房に効いた博物館によく行く。65歳以上は入場無料なので。一応入り口で年齢を照明するものを見せるが、私はどう見ても65歳以下には見えないだろう。もうすぐそのまま博物館に飾られてしまうかな。




2011

July

13

日記:: 毎朝、早く起きています。
コメント 0 / 0
朝早く目が覚めてしまいますが、最近は朝の方が気持ちが良いのでパソコンに向かっています。その後また眠くなって今日会社に着いたのは12時でした。



2011

July

12

日記:: フェイスブックに登録しました。
コメント 0 / 0
いつものカリカチュアをつけて登録しました。やっとこれで一通り登録が済みました。



2011

July

10

日記:: シャンプーの必要量
コメント 0 / 0
頭を洗うのに最近は数滴ですみます。もうすぐいらなくなるでしょう。



2011

July

07

日記:: ピョンチャンを辞書に登録
コメント 0 / 0

「ピョンちゃん」なんていうゆるキャラがすぐに思いつく。

エスエス製薬の株価が上がるかな。

ツイッタライザーで「ピョンチャン」の評価を調べたら30件中、良い12件、悪い4件でした。




2011

June

06

日記:: 英会話の練習を始めました。
コメント 0 / 0
 いつまで続くか分かりませんが、iPhoneで英会話を始めました。NHKのソフトは速さが調整できるので、遅くして聞いています。電車のなかでやっていると、あんな年寄りが何をしているのかとみんなから覗かれます。NHKのいい宣伝になっています。



2011

May

18

日記:: 地震のお陰で辞書に登録しました。
コメント 0 / 0
「地震酔い」と「地震雲」を辞書に登録しました。特に「地震酔い」という言葉は、今回の地震がなければ登録することはなかったでしょう。



2011

April

18

日記:: ツイッタライザーが新聞に載りました
コメント 0 / 0
ツイッタライザー「良い」「悪い」評価分類するソフトが4月18日の日刊工業新聞に載りました。比較的細かく書いてありますので、ぜひ読んでください。



2011

April

15

日記:: ツイッタライザー
コメント 0 / 0

  株式会社 言語工学研究所(本社:東京都新宿区、代表取締役:国分芳宏)は日本語の文章を独自の理論によって意味解析し、推奨の文章かクレームの文章に分類するクラウド対応ソフト『ツイッタライザー』を開発しました。

 

 『ツイッタライザー』はツイッターやクチコミ、SNS、アンケートの自由回答などを分析します。たとえば商品を「良い」と判断しているのか「悪い」と判断しているのかがわかります。

 

Googleに代表されるこれまでのテキスト処理では単語(キーワード)を対象として、統計的に処理しています。これに対し、言語工学研究所のソフトは単語と単語との関係を対象として、日本語文法にのっとって総合的に評価します。

 

本ソフトは100万項目の付属語辞書、1億項目の係り受け辞書などから構成され、約5年を費やして開発しました。口コミサイトの記事(15,000件)を用いて、投稿者の良しあしの判定と本ソフトでの良しあしの判定とを比較した結果、82.5%の精度がありました。

 

言語工学研究所では4月14日(木)から同社ホームページでベータ版を公開し、企業での試用に応えます。

 

詳しくは下記をご覧ください。

http://www.gengokk.co.jp/twitalyzer.htm

 

下記で140文字までの文章を評価する版をご試用いただけます。

http://www.gengokk.co.jp/ywtest/

 

WebAPIの試用サイト

http://ile.instorm.co.jp/ywtest/ywv1/h/

 




2011

April

06

日記:: 推奨の文章か、クレームの文章かを自動的に判定するプログラム
コメント 0 / 0

推奨の文章か、クレームの文章かを自動的に判定するプログラムがホームページから使って見られます。

 

 下記のサイトで使って見られます。

 http://www.gengokk.co.jp/ywtest/

 

WebAPI

http://ile.instorm.co.jp/ywtest/ywv1/h/

 

何か良い使い方がありましたらを教えてください。

 




2011

March

15

日記:: 表記の揺れ
コメント 0 / 0

日本語では意味も発音も同じなのにいくつもの書き方があります。

打ち合わせ。

打ち合せ。

打合わせ。

打合せ

打合。

これを表記の揺れといいます。日本語に揺れが多いのは日本が地震国のためです。
今回の地震は激しかったので、まだ呼び方が揺れています。 

東北関東大震災:NHK。 

東日本大震災:フジテレビ:TBS。 

東日本大地震:NTV。 

東日本巨大地震:テレビ朝日。 

東北地方太平洋沖地震:テレビ東京




2011

March

09

日記:: モダリティー
コメント 0 / 0
モダリティーの定義が言語学と、言語処理(工学)とで異なるようです。私がモダリティーという言葉を「シソーラスを組み込んだ意味解析システム 自然言語処理Vol17 No4」のなかで使ったら言語学の先生に不適当だと言われました。やむを得ず「付属語の並び」という用語にしました。昨日言語処理学会へ行ってきたのですが、私のような意味でモダリティーという言葉をどんどん使っていました。言語学の先生のいうモダリティーは益岡隆志の定義に厳密に基づいているようです。一番大きな差は否定を命題にいれるか(言語学)、モダリティーにいれるか(言語処理)でしょう。我々はやはり今後言語処理の立場で考えます。我々はすでに自社製の1,000,000行のモダリティーを所有しています。ご興味のあるかたはご連絡ください。



2011

February

24

日記:: 今、作っているシステム
コメント 0 / 0
アンケートはほとんどが物やサービスを推奨しているか、クレームかのどちらかです。これを自動的に判断して分類するプログラムを開発しています。



2011

February

20

日記:: ツイッターをやっています。
コメント 0 / 0
やはり、ブログへの書き込みが減ってしまいました。
ツイッターの方が気楽に書けます。
内容は相変わらず自虐的です。
http://twitter.com/KOKUBUYOSHIHIRO
 
 



2011

January

27

日記:: 多義語
コメント 0 / 0
「おかしい」という多義語があります。「異常」という意味と「面白い」という意味があります。私の顔のカリカチュアはおかしいと言われたのですが、どちらの意味でしょうか。



2011

January

25

日記:: 鉱物名の記述
コメント 0 / 0
動植物の名前はカタカナで書くことになっているが、鉱物の名前はなぜか漢字のままで書くことになっている。「崗」の字が常用漢字でないため「花こう岩」のように交ぜ書きにしなければならない。早くカタカナ書きにすべきである。誰が抵抗しているのでしょうか。



2011

January

23

日記:: 古きよき国分芳宏です。
コメント 0 / 0

また、書いてもらいました。当人はこの方が似ていると思っています。




2011

January

20

日記:: 係り受け辞書
コメント 0 / 0
意味解析で、係り先を決めるためと、リコメンデーションで良しあしを決めるために、係り受けの辞書を構築しています。係り受けとは「鳥が鳴く」のように名詞+助詞+動詞の組み合わせです。
7万行登録してあります。さらに係りの名詞と受けの動詞をシソーラスを用いて拡張していますが、用語の多義性の問題が残り、どの意味で拡張するべきかを考える必要もあります。
係りの名詞が1語でおさまらないものがあります。例えば「帰国の途につく」と言ったようなもので、係りの部分が「帰国の」と「途」の2つの文節からなっています。「帰途につく」と置き換えることもできます。今「帰国の途」のように係りの部分が複数の文節からなる係り受けを集めています。



2011

January

19

日記:: 助数詞の多義語
コメント 0 / 0
1時3分(ぷん)、1割3分(ぶ)。よく使うせいもあってこの辺は読み間違えるひとはいません。日本人は無意識のうちに意味を考えて読んでいます。このような例は他にもあります。



2011

January

15

日記:: 固有名詞
コメント 0 / 0

規則音声のためにテキストを発音に直す仕事をしています。固有名詞の意味違えが多くて困っています。同じ漢字でもいくつもの読み方があります。「国分」という姓はちょっと前までは私と同じ読み方の「こくぶ」と呼ばれていましたが、最近はTOKIOの「国分太一」の方が有名になって「こくぶん」と呼ばれることが多くなりました。他に同じ字で「くにわけ」と読むひともいるそうです。

国分という姓は元々国分寺に関係があったのっだそうで、いろいろな地方にいます。しかし面白いのは東北の人は「こくぶん」、南の方のひとは「こくぶ」と読むようです。我が家の場合も祖先は関西です。

もうひとつ、同じ字で書いた姓を「くにわけ」のように異なる読み方をするのは私の考えでは、分家をしたときに同じ名前が近所に多すぎることになるので、少しでも変えようとしたためでしょう。

このようにいろいろな読み方があるのは、ルビを振ったり、テキストからの音声合成するシステムの泣き所です。




2011

January

14

日記:: 出来上がる。
コメント 0 / 0

昨晩も飲んだのですが、私がホストだったので、早目に会館に行っていました。気にするゲストでもなかったので、先に一人で飲み始めていました。ゲストが少し遅くなったので、ゲストが来たときは私はすっかり出来上がってしまっていました。

多義語 建物が出来上がる(完成)、人が出来上がる(酔う)




2011

January

12

日記:: 英語の多義語
コメント 0 / 0
レコメンデーションのために辞書上の用語を良しあしで分類してあります。ナイーブ(naive)という用語は英語の辞書を調べると良い意味だけではなく馬鹿正直といったような悪い意味も載っています。このような用語は、他にトレンディー、ユニークなども良い意味と悪い意味があります。しかし幸いなことに日本語には良い意味だけが輸入されたようです。



2011

January

11

日記:: 同義語と同音異義語
コメント 0 / 0
例えば、平仮名でかいて「とる」という用語にはいくつもの漢字が当てられていて辞書によっても異なっています。係り受け関係で整理していて、どこまでを同義語とするべきかが悩ましいところです。逆に「あつい」という用語は「厚い」と「熱い」とでアクセントも異なるので明らかに別の言葉と判断できます。



2011

January

10

日記:: 漢語の多義語
コメント 0 / 0
漢語は日本語や英語に比べて多義語が少ないような気がします。私論ですが中国が多民族国家のためだと思います。いろいろな言葉を話す人に情報を正確に伝える必要があったからでしょう。もしかすると、元々の中国語には、いくつかの意味があったが、日本語に輸入されたときに1つの意味以外が捨てられてしまったからかもしれません。例外もあって「勉強」のように日本語に溶け込んでいる用語は「学習」という意味の他に「値引き」という意味が派生しています。



2011

January

09

日記:: 古きよき国分芳宏のカリカチュアです。ご笑覧ください。
コメント 0 / 0

ツイッターで使っています。似てますか。




2011

January

06

日記:: 今年からツイッターをはじめました。
コメント 0 / 0

KOKUBUYOSHIHIROという名前ででています。

まだプロフィールも張り付けてないのですが、

近いうちに整備します。




2011

January

01

日記:: 明けましておめでとうございます。
コメント 0 / 0

昨年9月からフィットネスクラブに通っています。

フィットネスクラブと言っても体重は1キロ増えましたが、体調がよくなりました。

「ブヨンブヨン」だったお腹が「ブヨブヨ」程度になりました。

少し寒さにも強くなったような気もします。

今年もよろしくお願いいたします。




2010

December

31

日記:: 大掃除
コメント 0 / 0

休みに入って大掃除をしていたら、「日本語の多義語動詞」国広哲弥という本を見つけました。

すっかり忘れていましたが、見るとどこの本屋で買ったかは覚えています。

どこかの本屋で同じ本を見つけたら、また買ってしまったでしょう。同じ本を2冊買って後悔することがよくあります。

おかげで暮れはその本を調べることですっかりつぶれてしまいました。

今年一年ありがとうございました。

よいお年をお迎えください。

 




2010

December

30

日記:: 親指族
コメント 0 / 0

携帯電話を一部の人だけが使っていたころ携帯電話を使う人を「親指族」と呼んでいた。

今はほとんどの人が携帯電話を持つようになったので、親指族という言葉は聞かなくなった。

しかし私は不器用で、人差指で携帯を操作しているのでこんどは「人差指族」というごくまれな人種になりそうです。




2010

November

26

日記:: 新常用漢字
コメント 0 / 0

まだ先だろうと思っていたのですが新常用漢字が内閣で告示されるようである。

ご存じのように、この中でシフトJISで表せない文字が4つあります。

 𠮟、塡、剝、頰

これらの文字に対応する文字がすでにシフトJISのなかに定義してあります。

 叱、填、剥、頬

なぜこんなことになってしまったのか、私には理解できません。

この問題の4文字はシフトJISのなかにある文字を使って、

みんなでシフトJISで表せない文字を無視しようではありませんか。

シフトJISの中の文字の字体を少し変更すればよいだけの話ではないですか。

次回常用漢字を決める人にはもう少し賢い人を選んで欲しいと思っております。




2010

November

12

日記:: アドレスのアクセント
コメント 0 / 0

尖閣諸島の問題でビデオを投稿したIPアドレスが問題になってテレビにもよく「アドレス」という言葉が出てきます。

ドレス」と平板型のアクセントで話しています。

インターネトがはやり始めたころは、テレビなどでは「ドレス」と頭高でした。

当時、コンピューターの業界では、「ドレス」と平板で話していました。

この言葉が一般的になったということでしょう。

 




2010

November

09

日記:: アンクレット
コメント 0 / 0

 アンクレットというと足を飾る足輪を思いつく人が多いと思いますが、踵から下だけの靴下の意味もあります。

 夏に半ズボンにソックスをはいていたときに家族にみっともないからと言われてアンクレットを履き始めました。

 寒くなっても、倅のお古のアンクレットを履いているのですが、これが意外と暖かく快適です。

 考えてみれば、昔の足袋もこんな長さでした。一番末端を暖めると良いというのが昔の知恵かも知れません。

 アンクレットは若者よりも年寄り向きです。




2010

November

01

日記:: 歩数計
コメント 0 / 0

 30日の土曜日は台風で雨が降っていたので、一日中座ったきり老人をしていました。

 その日一日の歩数計を見たら、なんと90歩しか歩いていませんでした。




2010

October

22

日記:: 類語のiPhone/iPad向けアプリを発売しました。
コメント 0 / 0
ブラウザで見る場合のURLです
http://itunes.apple.com/jp/app/id398300516

ご購入には、iPhone/iPod touch/iPad、またはPCのiTunesが必要となります。


iPhone/iPod touch/iPad、またはPCのiTunesのAppStoreで、
「言語工学研究所」か「類語.jp」で検索できます。

ファイルサイズが約22MBのため、iPhone/iPadの3G回線では
ダウンロードできませんので、その場合は、Wi-FiやPCで
ダウンロードしてください。
よろしくお願いいたします。



2010

October

19

日記:: フィットネスクラブに通い始めて1月になりました。
コメント 0 / 0

最初はだめだろうと思ったのですが続いています。

週に2回程度通っています。

でも体重は減るどころか1キロ増えてしまいました。

運動が終わった後のビールがうまいから。




2010

October

16

日記:: 世代と用語の意味
コメント 0 / 0

用語の意味を調べていると世代によって意味の異なるものがときどきあります。

        若い世代     中高年

クール    かっこいい    冷淡

やばい    魅力的      危ない

話している人の顔を見てから意味を考える必要があります。                  

 




2010

October

07

日記:: ノーベル賞が発表されました
コメント 0 / 0

ノーベル物理学賞は「グラフェン」についての研究だそうです。またノーベル化学賞は「クロスカップリング反応」についての研究だそうです。

手前味噌になりますが、弊社のシソーラスにはすでに登録してありました。ノーベル賞をもらうのは研究が終わって知識が一般になってからのようです。




2010

October

04

日記:: 多義語 片仮名語
コメント 0 / 0

「ノート」というカタカナ語を手元の国語辞典で引くと5種類の意味が載っています。
 覚え書き
 注解
 筆記
 調子
 ノートブック

我々のシソーラスには次の4種類の意味を登録してあります。
 帳面    この意味が一番普通だと思っています。
 パソコン  最近はこの意味でも多く使われています。
 注釈
 書く    この意味は最初はいらないと思ったのですがネットで

        調べてみると動詞としての用法も見受けられるので採用しました。

このほかに音符という意味もあるのだそうですが、無視しています。

ちなみに英和辞典のnoteを見ると名詞として10種類、動詞として6種類の意味が載っています。




2010

September

30

日記:: 東国原知事
コメント 0 / 0

宮崎県の東国原知事が次の知事選に「出馬させていただかない」と言っていました。(すぐに言い直しましたが)

難しい言い回しなので、この文を弊社の意味解析プログラムにかけてみました。

その結果、モダリティー(意図)は

 否定

 依頼

 丁寧

 意志

と4つがでてきました。

彼は出馬に関して、こんなことが言いたかったようです。

 

 




2010

September

22

日記:: 突然、フィットネスクラブに通い始めました
コメント 0 / 0

通ったといってもまだ2回なのですが。何十年ぶりに体操をしました。

周りの人はどうせ三日ぼうずだろうといっていますが、体操着を買ったりして当人はやる気です。

1時間半いといろいろな道具を使って体操をしたあと、30分お風呂に入ってきます。

血圧も下がって調子が良いようです。(暗示に掛かりやすい方なので)

終わった後のビールがうまい。




2010

September

08

日記:: 純国産シソーラス
コメント 0 / 0

純国産という言葉を良く目にします。食品に書いてあることが多いのですが。

はなはだしいのには「純国産だからおいしい」と書いてありました。

どうして国産だとおいしいのか分かりません。

そういえば弊社のシソーラスも当然のことですが純国産です。

これからキャッチコピーに「このシソーラスは純国産だからすばらしい」とでも書いてみましょうかね。

やっぱりダメそうですね。

 




2010

July

22

日記:: 論文が採択されました。
コメント 0 / 0

「シソーラスを組み込んだ意味解析システム」という論文が自然言語処理 Vol.17 No.4に採択されました。

査読者の方が苦労されたようで、採択されるまでに大分時間がかかってしまいました。

査読者の先生に感謝します。

ご興味のある方は弊社のホームページからも見られますのでごらんください。

ホームページから使って見られるようにしてあります。

http://www.gengokk.co.jp/koubun/

是非ご意見をください。




2010

July

15

日記:: 使い捨て
コメント 0 / 0

いま使っている辞書はぼろぼろなのですが、近々常用漢字が変わるので我慢して使っています。

いつもは辞書はよく使うので使い捨てにしているのですが。

そういえばこの国では総理大臣も使い捨てのようです。




2010

July

14

日記:: パウル君
コメント 0 / 0

パウル君の言うとおりの結果でサッカーのワールドカップが終わりました。

パウル君効果で、「ブブゼラ」という言葉も全く耳にしなくなりました。




2010

July

07

日記:: 25年がたちました。
コメント 0 / 0

おかげさまで我が社も設立以来25年がたちました。皆様のおかげと感謝しております。

25年前というと皆様の覚えていらっしゃる事件では、日航のジャンボ機が御巣鷹山に墜落した年です。

長い時間がたちましたが、まったく大きくなりませんでした。




2010

July

01

日記:: 多義語
コメント 0 / 0

大和言葉の「さめる」に対4つの意味で漢字を使い分けています。(後ろの2つは普通平仮名で書きます。)

  熱が冷める。

  目が覚める。

  酔いが醒める。

  色が褪める。

しかし、「あまい」に対しては「甘い」という漢字しかなかったので、表記で意味の違いが区別できません。

  菓子が甘い。      (甘味である)

  検査が甘い。      (手ぬるい)

 




2010

June

18

日記:: 新語
コメント 0 / 0

世界中が今南アでサッカーでもちきりです。始まる直前まではブブゼラが問題で禁止されるのではないかと騒がれていました。私もブブゼラという単語を辞書に載せるました。しかし、最近テレビを見るとバックで音は聞こえるのですが、あまり話題にならなくなりました。消さないとならないかもしれません。

 




2010

June

08

日記:: パワーポイント
コメント 0 / 0
 最近というか、大分前からなのですが、会話をしていて頭の中に浮かんではいるのですが、名前がでてこないことがよくあります。時間がたてば出てくるので忘れているわけではないようです。大勢の人の前でしゃべるときには、パワーポイントが必須でこれがなければ、時間ばかりかかって何も話せないでしょう。パワーポイントはありがたいものです。



2010

June

04

日記:: 固有名詞
コメント 0 / 0

 芸名や相撲取りの名前は登録しておいても消えてしまう固有名詞が時々あります。筆者らの辞書には消えそうな固有名詞には、後でチェックして削除出来るように特別なフラグをふってあります。

 最近この意味のフラグを付けた政党名をいくつか登録しました。

 




2010

April

16

日記:: 東京の中心
コメント 0 / 0

地下鉄の東西線と南北線とJRの中央線の交差する所に飯田橋駅があります。

まさに東京の中心です。近くにはいつでもお酒が飲める神楽坂があり、後楽園もすぐ近くです。

ここにみんなに愛されている「言語工学研究所」があります。

その会社では純国産「日本語シソーラス」を作っています。

 




2010

April

05

日記:: テレビと新聞
コメント 0 / 0

人が並んだ状態を言うのにテレビと新聞とで異なります。

大行列ができた。       新聞(短く簡潔に)

長蛇の列ができた。     テレビ(他の人とはなるべく違った言い方をしたいのでしょう)

私はテレビでも、もっと簡潔な言い方ができないかといつも思っています。




2010

March

18

日記:: 外来語の表記
コメント 0 / 0

 ある権威のある雑誌を読んでいたら「ソフトウェア」という表記を目にしました。

 私は書くときも、読むときも「ソフトウエア」といっています。

 ソ | フ | ト | ウ  | エ | ア  6拍

 ソ | フ | ト | ウェ | ア     5拍

 私の周りでもみな「ソフトウエア」と発音しています。 コンピューターの畑以外でも「フォーマルウエア」のように「ウェ」ではなく「ウエ」と書いているようです。「ソフトウェア」と書いた方がスマートにみえるのでしょうか。

このような例は「フイルム」「フィルム」などでも見られます。私には「フィルム」と発音するのを聞くとキザに聞こえます。




2010

February

15

日記:: コーパス
コメント 0 / 0

コーパスとは文例データのことをいいます。 

国立情報学研究所が「Yahoo知恵袋」のデータを研究開発用に提供しています。

 弊社も借用して使わせてもらっています。これまで弊社ではコーパスがないので、よいシステムが作れないという言い訳をしてきましたが、これからは、そんな言い訳はできなくなりました。

 これらのコーパスを解析してみて、解析プログラムの不備を見つける。

 システムを修正した前後でコーパスを解析してみて、うまくいったのか改悪してしまったのかを調べる。

などに使っています。 非常に役にたっており、感謝しております。




2010

February

11

日記:: 今度は足が痛くなりました。
コメント 0 / 0

みんなに酔っ払って転んだのだろうといわれました。

最近は飲み歩いてはいないのですが。

一生懸命歩いて体重を維持しているのですが、歩かなくなるとすぐにまたメタボが心配になります。




2010

February

04

日記:: おだてられて学会誌に書きました。
コメント 0 / 0

論文といっても技術資料なのですが自然言語処理という雑誌の今月号に載っています。

「複数の観点で分類した自然言語処理用シソーラス」Vol.17 No.1 P247

ホームページから読めますので、ぜひ読んでみてください。

これまで「かく」ものといえば「恥」で、「買う」ものといえば「顰蹙」ぐらいだったのですが

おだてられて書いてしまいました。




2010

January

26

日記:: ている
コメント 0 / 0

前にも書いたかも知れませんが「ている」という付属語の並びは前に来る動詞の性質によって意味が変わります。

「切れている」    過去の結果の状態

「見ている」      現在進行

先日、友人に「奥さんは、いつも何しているんですか」ときかれました。

すぐに私は「太っています」と答えました。

そう「ている」にはもうひとつ意味があります。

現在の状態を表します。




2009

December

28

日記:: 腰痛
コメント 0 / 0
 暮れの会社の大掃除で本箱を移動させようと押しました。まったく動かなければあきらめたのですが、何とか動いたもので全力で押しました。20センチ程度動かしたのですが、そのあと腰が痛くなってしましまいえらい目にあいました。そのあと風邪をひいてしまい、さんざんな年末になりました。自宅の大掃除は逃げられましたけれど。



2009

December

21

日記:: 忘年会シーズンが終わりました。
コメント 0 / 0
今年もやっと忘年会シーズンが終わりました。やはり一番恐れていたことがおこりました。そう、体重が戻ってしまいました。年の瀬が心配です。



2009

December

08

日記:: ステレオと3D
コメント 0 / 0
ステレオという言葉は音響装置の代名詞になっています。ところがこれは聞く人のいる平面だけをサポートしているので、ステレオというより、プレーンと言った方がよいのではないでしょうか。そして今3Dと言っている立体画像投影装置の方を「ステレオ」と呼ぶべきだと思います。



2009

November

18

日記:: 俳諧
コメント 0 / 0

 いい天気なので事務所の近くの後楽園に行ってきました。普通の人は入園料は300円なのですが65歳以上は150円です。紅葉はまだ少し早いようでした。日照りが暖かいためか、人出はかなりありました。でも見回すと私を含めて150円の人ばかりでした。




2009

November

02

日記:: インフルエンザ
コメント 0 / 0
今朝の天気予報で今日は寒くなると言っていました。私はこれまでインフルエンザのような現代的な病気にはかかったことはないので、だいじょうぶだと思っています。それに毎日アルコールで消毒していますから。しかし、今風邪を引くと新型インフルエンザと疑われて、騒ぎが大きくなりそうなので用心のためにコートを着てきました。しかしさすがにまだコートを着ている老人は見かけませんでした。



2009

October

25

日記:: 5日間禁酒をしました。
コメント 0 / 0
目の手術で入院したためです。入院中はどこが痛いというわけではなく、お酒が飲めなかったことだけを除いて快適でした。看護婦さんとも話はできるし。
体重が増えていました。ということは私の体重が増えるのはお酒のせいではないことが証明されました。



2009

October

01

日記:: シソーラスと検索
コメント 0 / 0

シソーラスの一番身近な利用法に検索のときに適切な検索キーワードを見つけることがあります。よく言うのですが、料理の記事には「料理」という用語は使われていません。「下ごしらえ」「和える」「みじん切り」のようなもっと狭義の用語で検索する必要があります。このような狭義の用語は数が多くて検索しているときになかなか思い出せません。そのようなときにシソーラスを使います。

シソーラスを組み込んだ全文検索を出荷しています。ホームページに掲載してありますので、一度ご検討ください。




2009

September

24

日記:: 付き添い
コメント 0 / 0

歩くのが目的で連休に都立の庭園を3か所も回ってきました。どこも丁度彼岸花が満開でした。老人週間ということで、都立の庭園は老人とその付き添いは無料でした。女房はまだ有料なのですが、私の付き添いということにしてすべて無料でした。(老老付き添い)




2009

September

17

日記:: ダイエット
コメント 0 / 0

医者にメタボと言われてやむを得ず減量をしました。
お陰で、体が軽くなって血圧まで下がりました。
また、昔着ていた背広が着られるようになりました。
最近ある会での写真を送ってもらったのですが、
久しぶりで自分の顔写真を見たらだいぶしなびていました。

メタボには変わりませんが。




2009

September

12

日記:: ペコピ 複数のアンケートの類似性を調べます
コメント 0 / 0

優遇措置のあるアンケートに、同一人が出したと思われる類似した回答が何件も来ることがあります。
その結果、市場調査が偏ってしまうことがあります。
また、学校の複数の生徒がコピペで同じようなレポートを提出するという話をよく聞きます。
形態素解析して、複数のアンケートに共通の文節の数を数えて類似度を測るシステムです。

一致率を表示します。完全に一致するときは100パーセント
利用者が設定した閾値以上の組み合わせを出力します。

ホムページから無料でダウンロードできます。500件まで




2009

September

11

日記:: 係り受けと付属語連糸(2)
コメント 0 / 0

「依頼」の意図を持つ「付属語連糸」だけでも、丁寧さの違いなのでいくつかの言い方があります。

 

 飲んでほしい

  飲んでください

  飲んでくださいませんか

  飲んでくれ

  飲んでくれないか

  飲んでくれないです

  飲んでくれない

  飲んでくれませんか

  飲んでくれませんですか

  飲んでちょうだい

 

ここにあげたものは主なものだけで、これ以外にもいくつもの書き方があります。




2009

September

06

日記:: 来客
コメント 0 / 0

 来社するお客はほとんど夕方です。手帳を見ると夕方だけがスケジュールが入っています。

 当然、最初からビールということになります。何回も来社してくれている人でお茶を飲んだことがない人がずいぶんいると思います。




2009

September

02

日記:: 係り受けと付属語連糸
コメント 0 / 0

我々の解析システムでは「係り受け」と「付属語連糸」とに分けて管理しています。

係り受けには「係り」、と「受け」の組み合わせで、「受け」の自立語の語幹までが収納してあります。それから後に続く付属語の連糸をまとめて収納してあります。「係り受け」の一番の機能は多義語の弁別です。例えば「高い」というよく使う形容詞でも次の二つの場合では異なった意味に使われています。反義語も異なります。

            反義語

 背が  高い    低い

 値段が 高い    安い

もう一つの機能は単語だけでは決められない「良しあし」を決定することです。「寿命」「長い」「短い」単独では良しあしの意味を持っていませんが、組み合わさると「良しあし」の意味が出てきます。

 寿命が   長い   (良い)

 寿命が   短い   (悪い)

次に付属語の連糸は「係り受け」に対して書き手の意図を与えます。また人称が推察できます。

   意図     人称     例

  願望    1人称   飲みたい

  意志    1人称   飲もう

  許可要求  1人称   飲んでかまいませんか

  依頼    2人称   飲んでください

  勧誘    2人称   飲みますか

  禁止    2人称   飲んではなりません

  確認    2人称   飲んだね

  伝聞    3人称   飲むそうだ

  疑問          飲めますか

  義務          飲むべきです

  譲歩          飲んでもかまいません

  推量          飲むだろう

 

用語はシソーラスで同義語などを拡張します。

意図の種類は、解析プログラムの適用分野によって、今後追加していきます。

良しあしは、付属語連糸が否定のときには逆になります。

実際には、「係り受け」と「付属語連糸」はここで述べたように独立して決められるものではなく、お互いに干渉する場合もあります。現在干渉する場合の規則を整理しています。

 

参考 益岡隆志 日本語文法の諸相 第7章 命題とモダリティの境界を求めて くろしお出版




2009

August

20

日記:: シソーラスのVer7を出荷しました。
コメント 0 / 0

 久しぶりでシソーラスを更新しました。42万語になりました。

20回までは無料で使えます。試用してみてください。

(これまでに20回使い切った方もまた使えるようにしました。)

 




2009

August

16

日記:: ジーパン
コメント 0 / 0
 この年をして初めてジーパンを買いました。お腹の出っ張ったところより下の方に合わせるので思ったより小さなサイズでした。若い人は新品のままはいて外にでかけるのは恥ずかしいのだそうですが、私場合は、着古したように加工したものはやめました。あまりに惨めに見えそうなので。