メモ

http://code.google.com
グーグルコードの説明を読んでると、
「よく巷ではこういう風な解説がしてあるが、それはベストな方法ではないから、こうしたほうがいいよ。」
みたいなアドバイスがあって何気に参考になる。
しかも、突っ込んでるポイントが役に立つものばかり。
説明も簡素で、書いてあるプログラムもシンプル。

メモ

中国語サイト
ヤフーからのアクセスが意外に多い。中国のヤフーは、今はアリババ傘下になっていて検索エンジンも独自のものらしい。使ってみたらやけにシンプルだった。アリババは最近Sohuの検索技術も買っている。各ポータルサイトの検索エンジンがどうなってるかまだ把握できてない。

百度の検索エンジンは日本版と中国版で結果が全然違う。これはグーグルも同じ。
今は中国版グーグルに行くと香港版に飛ばされる。
百度は、検索ワード入れても正確な結果が出ないことが多い気がする(T_T)

百度は、中国版だと、まず百度百科、次に百度知道の結果が来るものが多い。百度知道は日本のヤフー知恵袋みたいな物で結構充実してる。
百度の日本法人の人が書いた本に読んだところ、中国では百度を使うメイン層は、単語で検索する習慣はなく、文章で検索するらしい。グーグルやヤフー使う層は単語で検索する習慣があるらしい。が、中国は時代の流れが速いので、この習慣もすぐ変化する可能性があるとのこと。

イリューシン76輸送機(Il-76)

ii76

ii760
BBC – Top Gear 公式サイト
年末にBBCのTopGearを見ていたら、番組の冒頭に妙にかっこいい(特に肩の部分の曲線が美しい)飛行機が出てきた。グルジアからイラクまで撮影に使う車両を運ぶためのもので、調べてみたらロシア製のジェット輸送機で名前はイリューシン76輸送機(Il-76、ロシア語だとИл-76)という飛行機だった。ロシア製に独特のこの造形美はどこからくるんだろう。

グルジア情勢 外務省
グルジアの情報は外務省のサイトがシンプルでわかりやすかった。

イリューシン76輸送機は、ソ連時代にイリューシン設計局という、当時ソ連では代表的な航空機設計局が開発したもので、初飛行は1970年代、今でも生産されているらしい。

イリューシン公式サイト
イリューシン設計局が開発した航空機一覧
1970年代に複数の巨大輸送機が開発されてるのは、何か時代の流れと関係がありそう。

探してみると、プラモデルも結構発売されている。

【エクスプレッソウイングス】IL-76 AWACS 中國人民解放軍空軍 (30074)0685PL1/500
【エクスプレッソウイングス】IL-76 AWACS  中國人民解放軍空軍 (30074)0685PL1/500

Il-76 ロシア非常事態省 (1/500 502313)
Il-76 ロシア非常事態省 (1/500 502313)

1/500 イリューシン IL-76 国際連合軍/アビアコン・ジトトランス (515344)
1/500 イリューシン IL-76 国際連合軍/アビアコン・ジトトランス (515344)

【香港エクスプレッソウィングス】イリューシン IL-76 シリア航空1/500 Sky500
【香港エクスプレッソウィングス】イリューシン IL-76 シリア航空1/500 Sky500

【エクスプレッソウイングス】IL-76MD 高麗航空 (P-912)03481/500
【エクスプレッソウイングス】IL-76MD 高麗航空 (P-912)03481/500

この高麗航空というのは北朝鮮の唯一の航空会社で以前は高麗航空のイリューシン76が日本まで北朝鮮産のマツタケを空輸してたとウィキペディアに説明があった。

3種類の文章解析

ウィキペディアのAPIを使いたくていろいろ調べてみた。
ウィキのブガッティに関する文章を使い3種類の解析をした結果。名詞のみ。

形態素

<word>

<surface>ヴェイロン</surface>

<reading>ヴぇいろん</reading>

<pos>名詞</pos>

</word>

<word>

<surface>フォルクスワーゲン</surface>

<reading>ふぉるくすわーげん</reading>

<pos>名詞</pos>

</word>

メジャーな名詞はすべて解析してくれた、精度高い。

係り受け

<Morphem>

<Surface>ヴェイロン</Surface>

<Reading>ヴェイロン</Reading>

<Baseform>ヴェイロン</Baseform>

<POS>名詞</POS>

<Feature>名詞,名詞,*,ヴェイロン,ヴェイロン,ヴェイロン</Feature>

</Morphem>

<Morphem>

<Surface>フォルクスワーゲン</Surface>

<Reading>ふぉるくすわーげん</Reading>

<Baseform>フォルクスワーゲン</Baseform>

<POS>名詞</POS>

<Feature>名詞,組織企業,*,フォルクスワーゲン,ふぉるくすわーげん,フォルクスワーゲン</Feature>

</Morphem>

なぜかフォルクスワーゲンが企業名というところまで教えてくれる。ただしブガッティやヴェイロンは名詞までしか出てこない。

キーフレーズ

<Result>

<Keyphrase>ヴェイロン</Keyphrase>

<Score>100</Score>

</Result>

<Result>

<Keyphrase>ブガッティ・オトモビル</Keyphrase>

<Score>98</Score>

</Result>

<Result>

<Keyphrase>フォルクスワーゲン</Keyphrase>

<Score>43</Score>

</Result>

キーフレーズだとスコア順で表示してくれる。
感覚的にもかなりいいところいってる。ただし、今度はブガッティ・オトモビルは出てくるが、ブガッティが出てこなくなった。便利だけど、実際に使おうとすると大変そう(T_T)
やはり正規表現の力技でやるしかなさそう。

eclipseとか

eclipseの使い方がだいぶんわかってきた。
前はテキストエディタでプログラムを書いてが、無駄なことをし過ぎてた(>_<) 素直にいいものは取り入れるようにしよう。 最初は面倒くさそうに見えるものでも、必要なものはちゃんと身に着けておいほうが、結局近道になる。 あと、eclipseのPHPバージョン使ってると、本番環境ではでないエラーが出ることがあるけど、 中のPHPのバージョンの違いによるものらしい。