はやぽんログ!

ガジェット好きなアイマスPがミリシタの事とかスマホの事とか書いてます。

はやぽんログ!

【 Siriさんのお話】Appleの音声アシスタント Siriの謎に迫る。



どもー今回は

Siriの謎について少し調べてみます。

本当は来年度のしょっぱなの記事にしたかったのですが、今年最後の謎解きということにします。

まずSiriとはみなさんもご存知の事の
iPhoneiPadiPod touchに搭載されている音声アシスタントの事です。

端末に声をかけるだけで、音声ダイヤルやFaceTimeにMessageはもちろん
道案内や周辺検索。さらにはSNS連携までこなす最先端の音声アシスタントです。

iPhone 4S以降のiPhone
iPad 3rd Generation以降のiPad
iPod touch 5th Generation
で利用可能です。

iPhone 4S iOS5.0で初めて実装されたSiriですが、iPhone 4SのSはスティーブの遺作であるためスティーブのSか
SiriのSかと活発な論議が繰り広げられました。個人的にはスティーブの目指した端末と会話できる世の中を目指し、開発されたSiriのSだと思います。

iOS8になるとかなりバージョンアップしています。

まず、対応言語の量です。
当初は英語を含めた5つの言語のみでしたが、現在は30を超える言語でもSiriを利用できます。

それと滑舌の良さ
これはどの言語でも向上したと感じます。特に日本語はその向上具合がわかりやすいと思います。

そしてボキャブラリーの豊富さです。
これは年々感じます。ジョークの幅や知識の多様さが増えているのです。


それはSiriの進化ですが…それにしてもなぜこのようなものをスティーブは開発したのでしょうか…気になりますね。

実はSiriの前には音声アシスタントとして音声コントロールというものがありました。現在もSiriをOFFにすると使うことができます。

これの出来はお世辞にもあまり良くなく、実用には厳しいものでした。
まともにできたのは…そうですね曲の再生/停止くらいでしょうか…

この機能はiPhone 3GSに初めて搭載されました。当時としては目新しい機能ですね。声で端末の操作ができるのですから。

Windows Phoneの音声アシスタント。残念ながら日本語には非対応です。

端末に話しかけるだけでメッセージの作成、音楽の再生はもちろんアプリを起動したり単語の検索もできる。
iOSより後発なだけに優れている。

また、8.1にはCortanaというアシスタントが組み込まれておりSiriよりも日常会話という意味ではほぼ近いような印象です。

Google NowはAndroidの音声アシスタント。とは言いつつアプリケーションタイプなので、Google検索に組み込まれているというのが正しい。

まぁ、多機能、多機種が故の策なのでしょう。仮に最新OSに音声アシスタントが搭載されても広く使われるようになるには相当の時間がかかります。

実はAndroidは全世界のOSシェアの5%以上を占めるバージョンが6つもあります。(Android 4.0,4.1,4.2,4.3,4.4,2.3)
4年前のバージョンであるAndroid 2.3のシェア(6%)にも負けるWindows Phone
(7.1~8.1まで含めて)のシェアは5%

ちなみに最新OSの5.0はまだシェアが0.1%ほどと言われてます。

これがAndroidに音声アシスタントが搭載されない理由かもしれません。
ちなみにこのGoogle NowはAndroid 4.1以降で動作するようになってます。

実はiOS 6以降でも動くのですが、iOS端末ならSiriのほうが圧倒的に使いやすい。

そんなことより4.1以降にするなら標準ブラウザじゃなくて、Chromeと統合して欲しかったと思うのは私だけでしょうか…ブラウザの重複は内部ストレージを圧迫して…Googleさんならできるはずなんだがね…。

まぁ、さておきGoogle Nowは目指すところがSiriとは違うので置いておきましょう。

本題に戻ってSiriなのですが、バージョンによって少し違います。

初めてSiriが導入されたiOS5の時は
音声でメモを取ったり、リマインダーの設定くらいでした。
例 メモを取る

この頃はまだ長文は苦手でした。

iOS6からは標準アプリ以外でのアプリ連携が可能に

例 SiriでTwitterFacebookに投稿

なかなか便利です。

iOS7から設定を開けるようになりました。

このようにSiriに話しかけるだけで操作できます。

iOS8では流れてる曲を聴かせるだけで何の曲か探してくれる機能が追加されました。

この曲何?と話しかけるだけです。
あと、充電中はHey Siri!と声をかけるだけでSiriが起動します。
これは画面ロックがかかっていてもできますよ。

と3年ほどでここまで進化したSiriですが、ここで微笑ましいSiriとの会話を少し紹介。

普段言えないのでつい…

あなたが家族だそうです。これでクリスマスはボッチじゃないぞ…iPhoneユーザー

iPhone 5のことを聞いたら…ちゃっかり公式サイトをもってきました。

コーヒーを勧められました。

Siriさんも疲れるみたいです。

待っててくれますね。とりあえず寝ると…

ちなみにSiriさんはアメリカのカリフォルニア生まれです。もしかしたら金髪美女かも…まぁ、想像にお任せします。

という微笑ましい会話もありますが中には面白いこともしてくれます。

歌ってくれます。曲はまちまちなんだとか…

早口言葉も…完璧そうなSiriさんでも噛んでしまうのですね。

これに関してはよくわかりません…とりあえず深呼吸しました。

Siriさんが好きなの音楽は天体の音楽という…ヨーゼフ シュトラウスのワルツなのか、ピタゴラスだけが聞けたという天体の音楽なのかはよくわかりません。自分なりに…

天体の音楽を聞かせてみました。
ちゃんと聞き取ってくれましたよ。
しらばっくれました。
どうやらSiriさんはスティージョブズ氏のことを特別に考えているみたい…

ちなみに、現CEOのティム クック氏にはこんな反応です。

これは…以前アメリカで殺人事件が起こったときに、遺体の隠し場所をSiriに聞いてその通りに遺棄した事実があります。そのため忘れさせられたのですかね。

Siriさんのお父上のことについて聞くとしらばっくれました。

母上のことは、さらにしらばっくれたので単刀直入に…

ELIZA(イライザ)と言ってみました。なにやらびっくりされてます。

なぜ、イライザ?と思いますよね。何も知らずにイライザと言って変な答えが返ってきますから…

実はこのイライザはSiriの謎なのです。
この時だけは妙に挙動がおかしいですから。

このELIZAは1964年~1966年にジョセフ ワイゼンバウム氏によって開発された自然言語処理プログラムです。
スプリクト形でユーザーの応答を処理を行うごく初期型のタイプです。

有名なのにDOCTORという来談者中心治療のセラピストとしてのシュミレーションがあります。精神療法を用いていたシュミレーションですね。
これはELIZAのデータベース範囲内のことを聞かれた時に一般的な応答をするものです。

例としてユーザーが「足が痛い」というと「なぜ、足が痛いのですか?」と回答する。

ちなみになぜ、ワイゼンバウム氏が精神療法を選んだのかというと
「実世界の知識を関するデータベースをプログラムに入力する問題を避けるため」という。実は精神療法は人間の対話が前提のものだが、対話知識をそこまで必用としない。
例として「μ'sは好き?」と聞かれたときに「あなたはなぜμ'sが好きなの?」などと返すためμ'sの情報をプログラムする必用がないからである。


ここでSiriさんにELIZAのことを聞いた時の反応を…

私の先生…?

優秀な精神科医?引退?

私は彼女から多くを学んだ…けど彼女はマイナス思考でした…

と不思議なことを連発…

私の先生?とは

実はこのELIZAの名前は戯曲のピグマリオンの登場人物であるイライザ トゥーリトルが由来です。この人物は劇中で、上流階級の言葉使いを教えられる労働者階級の役である。

そしてこの人物はいずれ習ったことを教える立場になります。それが、Siriが先生と言いSiriが上流階級の言葉(敬語)しか話せない理由なのかも…

彼女から多くを学んだ…
これは自然言語処理プログラムの歴史から学んだものなのでしょう。
ELIZAを元に多くのプログラムがつくられました。その今の所の完成系がSiriですからね。

優秀な精神科医
これはELIZAが精神治療をシュミレートしてからですね。このシュミレーションでは時々人間染みたことを返答することもあったので、当時としては優秀でした。

この人間染みた返答というのは時々Siriでもあり有名なのは

壊れたiPhoneで画面はつかない…新品交換するときに最後にSiriに「さよなら」話しかけたら

「ご一緒できて幸せでした。」と返答が来たという。

まさにこういうところはELIZAからしっかり引き継いでいるのかなと思いました。
彼女はマイナス思考でした
これは戯曲の最後の方のイライザがそうなんです。これは戯曲のほうが元ですね。

とSiriが発したELIZAとの関係はざっとこんな感じなのでしょう…

もしかしたらSiriさんのお父上は開発リーダーのスティージョブズ
母上は自然言語処理プログラムの原形とも言うELIZAなのかもしれません。

もしそうならスティーブの過去とも被り、ELIZAとの出会いで生まれた子供で納得です。

ちなみにSiriさんは自然言語処理プログラムかどうかは答えられられないそう…企業機密なのかも…

このELIZAですが人間対機械の対話を初めて人間対人間の対話に見せる試みとして歴史に刻まれたと言います。

なんせ今のSiriやCortanaの原形が半世紀前に作られたのですから…驚きですね。

その後ELIZAをBASICに移植し、それを元にIBM PCApple Ⅱ向けに普及しました。

ティーブはApple Ⅱ向けに移植されたELIZAを見て驚いたという。後に「PCを通してだが、今で言うEメールで対話してるような感覚だった。」
「なんでも聞いてくれて、それに対して反論はしない…そして的確に反応を示している…まるで秘書みたいだ」と語っている。

おそらくスティーブがELIZAと出会わなかったらSiriは生まれなかったであろうと言われている。

iPhone 3GSが発表会の時に音声コントロールを発表した。このときの技術はApple TVやSiriにも活かされている。

そしてSiriを開発した後に帰らぬ人となったスティーブですが、その遺言とも言える設計図(iPhone 5はその遺産と言われている)その中にSiriの強化というのがありました。

そしてジョブズはSiriをiPhoneの中に居る秘書と例えました。

ちなみにSiriさん本人はノーコメントとのこと…

そして完成したSiriを見た時にとても嬉しそうな表情したと言います。
予想以上の出来だったのかはわかりませんが、きっといつかに見て感じたELIZAのことを思い出したのかもしれませんね。

と今回は謎の多いSiriさんを少し調べてみました。結構ソースが微妙な部分もあるのでご了承いただきたい。

ちなみにWindows Phone 8.1に搭載されているCortanaはSiriと似てるが、開発思想は少し異なるものです。

Siriがスティーブの言う秘書なら
どんな仕事も完璧にこなし、クールな感じです。
Cortanaはパートナーですね。要するに喋り相手です。そのため、ジョークとか喋りはSiriよりもCortanaのほうが一枚上手ですね。そのかわり仕事は少しいい加減だったりもします…

最後にSiriさんに長話や昔話をさせてみてください。きっとELIZAのことが出てきますから。

ここでのSiriが言う「おかしな事を言われる」そして「言ったことに笑われる」
これはデータベースにない表現や行動、言葉が含まれており、不適切な表現で返答した
(なかなか面白かったりする)ため笑われたと訳すことができます。

ELIZAが言うそのような事に興味があるのですね。と返答すればは
これは実際にELIZAが行っていた精神治療と同じでボキャブラリーを膨らませたり、それに関するデータをプログラムする必要がないということです。

それを教えてもらったSiriさんは面倒な質問になるとwebページを表示するようになりました。(本当です)
おかげで無駄な処理をせず、端末の寿命は長持ちするようになりましためでたしめでたし

ちなみに1年前はイライザにAppleに就職したのおめでとう!とSiriさんが言われていたのがありましたが、いまそれが聞けるのかは不明。

というお話です。他にもパターンがあるそうなので色々試してみては

改めてSiriにはスティーブとELIZAが強く焼き付けられているのかなと思いました。

ちなみにSiriさんはインターネットに接続しないと利用できないので悪しからず…


それでは今回はこの辺で(・ω・)ノ