はじめに

なんでこんな記事を書こうとしたかというと、機械学習の活用例って日本でhほとんど情報が入ってこないんですよねぇ、、で、仲良い先輩に機械学習の業務改善に関する事例を調べてーと言われたので、せっかくなのでブログでもまとめることにした。

ちなみに表題にある Machine Re engineering とは、機械学習を用いた業務の自動化による改善のこと。日本語に訳すとなんなんだろう。範囲はだいぶ狭いけど、マーケティングオートメーションとかは割とこの領域かもしれない。

実際のMachine Re-engineering はもっと範囲の広い話で、ビジネスプロセス全体を指す。クライアントとのメールのやり取りとか、日本ではあまり知られてない単語だけど、チャーン（churn）防止とかも機械学習用いると、圧倒的に改善できたりする。もうちょっと詳しく、改善できる範囲についてまとめてみる。

機械学習で改善できる範囲とは？

機械学習を用いた業務改善では、大別して以下の３つの領域で改善をすることができる。

コスト削減
CRM
売上高最大化

いくつか具体例を使って見ていくことにする。紹介する例としては以下の４つ。

カナダの銀行の音声照合による事例
Londonのスタートアップによる、「ドキュメント作成の自動化」
サンフランシスコベンチャーによる製造プロセスにおける、アラートの検知
賄賂・インサイダー取り引きを事前に検知する人工知能

などなど。どれも割とびっくりした内容があったのでそれをまとめてみる。

カナダに籍を置くNuanceって銀行

カナダにあるNuanceっていう銀行が、人の声紋を認識する音声照合を使って、1人あたりの対応時間を40秒も削減した事例。

音声照合での生体認証を導入

手順としてはこんな感じ。

お問い合わせの電話がかかってくる
自然な会話の中から、音声照合
本人確認をこの音声称号で済ませる

その成果は？

1人あたり４０秒くらい対応時間が減少したとか。自然な会話の中で音声照合を済ませて、気付いたら本人確認がなくなってるってすごく嬉しい。あのやりとりすごくめんどくさいんだよなぁ。。

日本でこれが可能なのか

音声照合は言語ではなく、人間の声紋をしっかり認識できるかどうかの問題なので、これはできない理由はないはず。音声認識っていう話だったら、日本語でやるのはなかなか難しいはずなんだけど（言語構造的な問題、日本語の優秀な音声認識サーバーは存在していないなど）。

ドキュメント化、データ入力（Arria : Londonに拠点を置くスタートアップ）

日頃よくあるドキュメント作成とか、データ入力。こういう単純作業に死ぬほど時間を取られると、１日が30時間あっても十分じゃない。しかも、こういう無駄で単調な作業は、かなりやる気も削がれる。できればやりたくない。

レポートの自動作成をする手助けをする

レポートの自動作成をする手助けをしてくれるやつ。自動作成といっても、完全に自動で文章が書きあがる訳ではない。この機械学習を利用したサービスは、自分の書いたテキストの編集をしてくれると思ってた方がいい。

具体的になにをしてくれるのか

バラバラで箇条書きにしたような文章を入力データとして、一個の完成度の高いドキュメントを書き上げる。箇条書きにした文章を入力としては、ちゃんとした一個のドキュメントを作ってくれるんだとか。顧客の業種の幅は広く、ヘルスケア企業から、ファイナンス、石油会社なども含まれる。結構ドキュメント化の多い大企業なんかだとすごく歓迎されるサービスなのかな。

どれくらい生産性があがるのか

生産性は25%くらい上昇したらしい。身近な数値に置き換えると、レポート作成のタスクの時間を40時間/月削減することに成功している。１日あたり２時間くらいフリーな時間ができるくらい。これはすごい。

日本でもできるのか

これまた日本語で、ラテン語系と同じクオリティで完成するとは思っちゃいけないはず。日本語は文章的なルールが崩壊しているので、文章を組み立てるのとかはすごく苦手だっていう話をよく聞くので。。

品質管理における問題解決 ( Sight Machine )

品質管理っていうよりもちゃんと言うならば、製造プロセスをしっかりと監視する必要がある。大きな倉庫でお互いの部署同士が連絡を取れない、そんな状況で部門横断的にアラートが鳴ったとしたら、原因究明には時間がかかってもしょうがない。

そんな悩みを抱えるあなたに！諦めないで、あなたにはSight Machine があるじゃない！あっという間にアラートの原因を特定、しかも「アラートが鳴る前に、やばいところを教えてくれる」機能までついてるとあったら素晴らしい。

アラートの原因追求

製造業の現場とかだと、１つの品質の問題の問題によって、何百ものアラートを同時に引き起こされる。そのいくつものアラートの根源になる問題を特定するのには通常非常に時間がかかるし、なんなら製造のプロセスを止める必要さえ出てきたりする。

Sight Machineはそのアラートパターンを学習して、問題を特定する手助けをするんだとか。しかし、次はもっとすごい。

アラートが出そうなものを、事前に感知する

さらに問題が出現する前に起こった事例のパターンも学習して、このままエラーが出そうなことを知らせることもできるらしい。そして前もって、エラーが発生する箇所を対処することで被害を最小限に留める。まぁよくあるパターンの機械学習ってやつなんだろうけど、これを実際の現場でやるってのはすごいなぁ。僕の好きなコマツのIoT事例の進化版みたいな感じ。

シンガポール最大の銀行による汚職防止作戦：DBS

知ってる人は多いと思うけど、以前にもまとめたようにシンガポールは人工知能大国。国ぐるみで人工知能を導入して、未来の社会の実験室にしてみよう、みたいなことを大臣が言っているような国。自分的には、このシンガポールみたいな国はすごくかっこいいと思う。保守的であるよりも、ドラスティックに未来だけを求める感じ、素敵。

賄賂やインサイダー情報の漏洩などの不正を犯しそうな人を事前判定

銀行の業務は結構直に色々な人の欲望に関わる。インサイダー情報だったら事前に知れればこっそりボロ儲けできちゃうし、銀行からの融資を受けられるかどうかであれば直に会社の存続に関わってくる。こういう感じのところではもちろん、きな臭い話は存在するみたい。

やってること

emailや社内での行動、ミーティングでの行動を元に学習させて、「汚職をしそうな人」を検出する人工知能。

銀行に関わる不正に関しては、前から検知する試みはあったみたい。そうなんだけど従来のやり方は、「詐欺・利回り」とかの外的要因についての研究だったとか。つまり会社ではなくて、第３者の機関が人工知能を使って市場を監視していたみたい。

DBSの例は結構有名なはずなんだけど、その上記の内容がその理由。社内の不正検出について活用された事例としては珍しいらしい。

日本でこんな例はでてくるのかなぁ。。

データ分析を始めるには、多額の初期投資が必要だったりする。データの分析をしたことがある人なら分かると思うけど、データの収集、クレンジングとかには死ぬほど時間がかかるし、専門家じゃないとできないくらい面倒臭くて難しい。しかも失敗するかもしれない。データ分析でいつも正しい結果が得られる訳がない。日本で機械学習を活用した成功例で話題に上がっているものはほとんど見ない。

そのような決断を日本の企業ができるのかなぁー、、と思うとすごくこう心が暗くなったりする。企業はできるかもしれないけど、その「機械にまかせよう」っていう素敵で合理的な無責任さを良しとしない社会も存在するような気がする。

僕は学ぶことが大好きで結構真剣にやったりしてる。だからこそその分感情を持つ人間の限界を感じる。感情が判断を鈍らせる人間である限り、100%合理的で理想的な行動をするなんて不可能だ。機械に任せて生産性を上げて暇を作って、趣味に時間を費やせるような世の中であるほうが素敵だなぁと思う。

2016-07-15

【思考段階】ストップ高を予想して、一攫千金狙い作戦〜構想編〜

背景

申し訳ないのですが、構想編なので、実装とかは今回のはありません。

ストップ高になる前の傾向を予想できたら、それに乗っかって、リスク少なくお金儲けができるんじゃないかなっていうので、作業進行中のやつ。ストップ安も同じロジックで発見できるはず

なんでストップ高になる株が予想できると思ったかと言うと、

お金の誘惑に勝てない人間は一定数存在するハズ
インサイダー的なフライングをする輩もいるハズ
データ解析してフライングゲットを検知
未公開情報手に入れなくても、甘い蜜を吸える

形的には法律的にグレーなところに相乗りしてる形になるんだけど、僕は未公開情報手に入れてないから、大丈夫だと信じてやってみよう、笑

何をするのか

いつも通りある銘柄のリターンインデックスを、日経平均のリターンインデックスで基準化して、その推移を見てあげる。でも、これ実はけっこうテクいことしなくちゃいけないかもしれなくて悩んでる。

株主優待後の下落を狙うの記事では、用意した関数が返す値が過去の収益率の期待値と分散だった。だから、一回分析しちゃえば、後はこっちで権利確定日の近くに、自分の納得できる銘柄を購入してあげればいいだけで。。

ただ今回のやつは、用意した関数が返す値が次の日にストップ高になかどうか。これは僕の知っている単純な統計とか機械学習じゃ対処できない話だったりする。（前に決定木で似たような分析した時は、精度があまりでなかった。）

つまり、現状何をしたらいいのかわからないが結論、笑　とりあえず知恵を絞った記録だけしておく。

できそうなこと１：日経平均との乖離率を見る

日経平均との乖離率の周期を見る。僕の考えている理想に当てはまる銘柄であれば、日経平均との乖離率がじわじわと上昇して、ある一定水準（X日なのか、乖離率Y%以上なのか）を満たした場合に、次の日にストップ高になる確率が高い。とかならイメージとも合ってるし、いけそう。

移動平均との乖離率を、ストップ高（安）前で見てあげるのでもいい結果出るかな。

とりあえず、【実装中】データを分析して、株主優待後の下落を狙って儲ける作戦〜構想編〜が終わったら、こっちから試そうかな。

2016-07-12

【実装中】データを分析して、株主優待後の下落を狙って儲ける作戦〜構想編〜

背景

データをうまく分析して、株主優待の前後で論理的におかしな動きをしてるやつを見つけて、そのタイミングでお金儲けができるんじゃないかと、分析を進めている。

いま、2000年以降の全ての株価データを引っ張ってきてる途中で、待ちが発生してるので、その間に優待の仕組みについて見てみる。で、分析手順と狙い所を見てみる。

ちなみに株は、好きな会社だけ買ってるほぼ初心者です。

儲けられるポイント

はじめに考えた儲けられるポイントは次の２つ。

株主優待の権利確定日に信用売り。落ち日に回収。
株主優待の権利落ち日に、買い注文。次の権利確定日間近で売り注文

１だと信用売りによるリスクは大きくなるけどただ、株を中期で持ち続けることのリスクも同じくらい大きそうなので（中国のバブル崩壊とか、諸々もたくさんあるし）、期間が短い方が成果が見えて楽しいので、１でやってみる。

２の方も同じロジックで組み立てられるから、実装してみるといいかも。株式を中期で保有するリスクはもちろんあるけどね

データ分析で何をするのか

ここまで書くと「データで分析しなくても、できるじゃん」って声が聞こえてくる気がする。そういう事ではないんです。。

金融の世界では３つの大事な指標があって、それぞれリスク、リターン、リターンの期待値（理論値）みたいなものがあるんですね。で、データを分析すると、リスクを最小にして、リターンが理論値に一番近い銘柄が抽出できる。

もっと噛み砕いていうと、ほぼ確実に儲かる銘柄をリスト化することが可能になる。僕の場合は、資金とか取れるリスクが有限だから、こういうことをしないといけないんです。。

だから今回も儲けやすそうな銘柄を探すための分析。

何をやろう

僕の知っている中で一番良さそうなのは、リターンインデックスを日経平均のリターンインデックスで基準化してあげて、優待日前後の変動の周期を見る。で、優待日前のある日と、優待日後のある日で差分がでかい日を抽出。

その変動幅と最低取引数とかを考慮して、リターンの期待値（平均値）とリターンのボラティリティ（分散・ばらつきの度合い）を出してあげる。

この分析によって得られるデータは、

買うべき日
売るべき日
リターンの期待値
リターンのボラティリティ（リスク）

かな？

あとは、自分の欲しいリターンと、リスクを勘案して購入すればOK

ここまで自動化できれば大満足。日経平均の上下によるリスクみたいなのは排除できていないんだけど、そこは甘んじて受け入れるしかないかなぁ。。

2016-07-07

人工知能搭載、ヘルスケアサービス系botアプリ「Health Tap」についてまとめてみる

調べた経緯

人工知能を活用したアプリを開発しようとしてる。前回まとめた中で、もっとも気になった「health tap」についてもうちょっと詳しくまとめてみようかなぁ、、と。医療先進国の日本だけど、このサービスは流行りそう。　ていうか流行った方が良い世界になりそう。

前回の記事はこちら:ここらで１つ、人工知能搭載アプリをまとめてみる

health tap とは

health tapは、人間の、健康に関する関わり方を再開発するものとして、2010年にローンチされたサービス。医者と、利用者がプラットフォーム上でやり取りしあうサービスみたい。

2013年の状態で、登録している医者の数は3万5000人、毎月1000万件の質問が投稿され、累計アプリダウンロード数は200万を超えてるんだとか。医師も無料で回答しているし、患者も無料で利用できるのか？？　どうやってお金稼いでるんだこの人たち。。

患者側の使い方は簡単で、主に以下の手順に沿って利用されている。

健康状態に疑問をもった人が、自分の症状を投稿する。（発疹がある、喉が腫れてる、とか）
人工知能がその症状に関して詳しい、適切な医者とマッチング
24時間以内に、その症状に対する対処法が回答される
みんなハッピーになる<3

ここで疑問に思ったのが、以下の２点。順に調べてまとめてみる。

どうやってその回答の厳密さを担保してるんだろう
医者の参加メリットは？
該当する国内サービスってあるのかな？

回答の厳密さを担保する方法

医者の参加するメリット、インセンティブ

health tap自身が発表している内容によると、医者が一回のログインで費やす時間は60分以上。激務なはずのお医者さんがなんで、こんなにたくさんの時間を割くのかは素直に不思議だなぁと、、

でもやっぱりお医者さんにもたくさんメリットはあるみたい。流行り（？）のゲーミフィケーションが使われているとかの他に、実務的な面でも。

受診不要な患者さんを減らすことによる、業務の効率化
潜在患者からの認知度
同業者からの認知度

があるらしい。いや、確かに。全部良さそうだけど、個人的には3が結構メリットありそう。医者ってなんだかんだ紹介ビジネスなところもあるだろうし。個人的な経験からもよく行く医者なんて、口コミで全部決めちゃうしね。。

類似の国内サービス

M3のアスクドクターズ？モデル的にはこれが似てるのかもしれないけど、個人的にはこれは流行らない気がする。というのも、月額でお金かかるのも結構しんどいし、怪我したってわざわざカードの登録とかしてから質問するようなサービスなら気持ちも萎えてやらないと思う。

自分がこれをやるなら、全部無料にして、既存のプラットフォーム（LINE, Messanegr）から質問を投げられるようにするかなぁ　これ是非作りたいなぁ　身近な課題で、必要そうだし、色々と面白い気がする。

2016-06-27

ここらで１つ、気になった”人工知能”搭載アプリをまとめてみる

機械学習・人工知能の勉強を最近してるんだけど、今世の中にどんなアプリがあるのかまとめてみたくなった。これらを調べてまとめた上で、これから作るアプリにうまい具合に詰め込んで、流行り遅れて人工知能アプリをうまく作りたい。

普通にsmartnewsとかGoogleアプリにも機械学習はふんだんに使われてるけど、ちょっと今風で新しいものを取り上げてみる。

人工知能AI英会話ナンナ

人工知能が話し相手になってくれて、英語が勉強できるサービス。無料だし。まだテストなのかな？そして自分が苦手な構文とかを、ナンナが指摘してくれるらしい。ほぉ〜

これがちゃんとできたら素晴らしい。

ナンナ

SENSY

ファッション×人工知能。コーディネートとかを出してくれるんだとか。自分の家にある洋服とか全部登録しなきゃいけないのかな？

そもそも朝ってそんなに時間無い気がするけど、、、使うシーンがイメージできないなぁ〜

SENSY

Less Mail

自動返信をしてくれるらしい。これは日本語の言語的な問題で期待できないんじゃないかなとか思いながら、これはちょっと使ってみたい

Less Mail

Health Tap

これはいいかもしれない。日本は医療先進国だから、なかなか注目されないのかもしれないけど、、、これも既にリソースを持っている人たちが、やっているイメージ

既にアメリカでは、毎月1000万件以上の質問が問い合わせされているとか。実際、これがあったらとてつもなく欲しい。

人工知能はおそらく、医師と質問者との効率のいいマッチングに使われているのかな？

Health Tap

SELF

いわゆるパーソナルアシスタント。会話ができたり、日常のログを記録してくれたり、ニュースとかを提案してくれたり。FBを見る限り、3ヶ月前くらいにスタートしたのかな？FBがビジネスページじゃなくて、いいね！できないのが印象的、笑

SELF

感想

あまり面白いモノないなぁ。なんとなく思ってたけど、人工知能ってやっぱり前面に押し出すものじゃない気がする。今ある人工知能押し出してる系のものって、マッチング・パーソナルアシスタントの２個くらいしかないのか。

Google PhotoとかAmazonのレコメンドとかの方が圧倒的にいけてるな。そもそも人工知能って言葉が氾濫しすぎてて、機械学習なのか、ただのプログラムなのか、ディープラーニングなのか全くわからない。雰囲気でビジネスやってる時点でそもそも終わってるのか。

今回思ったのは、 - 優れた人工知能を作るには、そもそも圧倒的なデータ量が必要 - 人工知能は効率化のための手段でしかない - 人工知能を前面に押し出してる時点で既にイケてない

人工知能アプリを作りたいなら、少し考えないとダメかもしれない、、と思った。

次回はみんなが好き勝手使っている”人工知能”って言葉をちょっと整理してみようと思う。

2016-06-21

東大が大学ランキング首位から転落！？人工知能が国を管理する近未来社会、シンガポールが１位なら納得かも。。

人工知能社会

東大がアジア大学ランキング１位から７位に転落

イギリスの教育専門誌がアジア各国の大学の最新のランキングを発表し、シンガポールの大学がトップに立った一方、このランキングで３年連続でトップだった東京大学は７位に転落しました。 NHK NEWSより

って報道を見て、朝から「いや、待てよ１位がシンガポール？東大も負けてないっしょ、おいいい！？」と憤慨していた。

で、録画してあった「NHKスペシャル：人工知能は天使か悪魔か」でシンガポールが取り上げてたのを思い出した。それを見て、「シンガポールが１位ならしょうがないか。。」 って納得して思わず書いたエントリー。

いやシンガポールやばいっすよ、まじ。人工知能を国ぐるみで有効活用している、アジアの小さい巨人でしたわ。

シンガポールの人工知能事情

シンガポールは国土が狭い。人口密度は世界第２位で、東京都の人口密度も軽く上回っている。そんな中国際社会で生き残っていくために、国ぐるみで人工知能を活用した効率化社会を実現しようとしている。

NHKスペシャルの「人工知能は天使か悪魔か」で、シンガポールのスマートシティ大臣みたいな人が

人工知能で国を効率化する。シンガポールはその実験室になる。

みたいなことを言ってて、すっげーやる気だな、、って感心した。。

実際の取組を見てみても、

渋滞を未然に防ぐ
国営マンションの住人の健康状態の把握
銀行でワイロなどの不正を事前に察知！

など。これを国と企業が協力して進めているんだから、凄まじい。自国の国際社会での状況などをしっかり把握してやっててすごい。。

いくつか簡単に紹介。

人工知能で不正を監視！

シンガポールの銀行が取り入れている人工知能。従業員の行動やチャット、社内メールの内容を解析して、不正をしそうな人指数みたいなものを定義。それを元に、収賄とかインサイダー取り引きとかを未然に防いでるのだとか。

その的中率は約9割!!とんでもねぇ。。

老人の孤独死はさせない！

シンガポールの国営マンションには監視するためのカメラを全ての部屋に設置するらしい。監視と言っても悪い使われ方は一切していなくて、 - 普段とは違う行動をしている人の健康状態の把握 - 異常があればその緊急度を察知して、家族や医師に連絡するかを判別 - みんな幸せ！ばんざい！

ってなるとか。日本の老人を全てこういった国営マンションに住ませて、日常生活に困ってる度を人工知能で計測。それが高い順に老人ホームとかに入れてあげるとかしたらもっと世の中は幸せになりそうだなぁ。。って思った

人工知能で渋滞改善

車の平均速度を測定、渋滞が起こる前兆の速度みたいなものを人工知能を活用して測定。それを検知すると、青信号の時間を延ばして渋滞を未然に防ぐらしい。。

こんな感じの社会は近未来だと思ってたのに、すぐ近くの国で実現されているなんておったまげたとんでもねぇな、シンガポール！！

2016-06-20

機械学習・Computer Scienceを勉強する。リソース一覧

学びコンピューターサイエンス機械学習

機械学習・自然言語処理・コンピュータサイエンスを学ぶためのオンライン・オフラインリソースたち。

Coursera Machine Learning

言わずと知れた機械学習の動画。Andrew Ngさんが丁寧に教えてくれる。日本語字幕あり。

www.coursera.org

Coursera Natural Language Processing

Courseraの自然言語処理講座。英語。

www.coursera.org

言語処理100本ノック

こちらも言わずと知れたリソースかも。自然言語処理をプログラミングするために必要なプログラミングテクニックとかが学べる。

www.cl.ecei.tohoku.ac.jp

Udacity Design of Computer Programs

これでプログラミング中級者。Python。動画を見ながら問題を解いていく形式。埋め込みエディタ。

www.udacity.com

Udacity deep learning

Udacityのディープラーニング。Googleが提供しているTensorflowでディープラーニングを学ぶ。

www.udacity.com

Paiza プログラミングスキルチェック

アルゴリズム問題を解いていく。DランクからCランクくらいまでサーッとやると言語の文法を一通り確かめられる。組み込みメソッドとかね。慣れてきたらAやSに挑戦。

paiza.jp

以下オフライン教材(書籍など)

集合知プログラミング

検索エンジンやレコメンドシステムなどを実装する。Python。

集合知プログラミング

作者: Toby Segaran,當山仁健,鴨澤眞夫
出版社/メーカー: オライリージャパン
発売日: 2008/07/25
メディア: 大型本
購入: 91人クリック: 2,220回
この商品を含むブログ (277件) を見る

確率的言語モデル

言語処理の参考書。

言語と計算 (4) 確率的言語モデル

作者: 北研二,辻井潤一
出版社/メーカー: 東京大学出版会
発売日: 1999/11
メディア: 単行本
購入: 10人クリック: 91回
この商品を含むブログ (44件) を見る

PRML

黄色い本。

パターン認識と機械学習上

作者: C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇
出版社/メーカー: 丸善出版
発売日: 2012/04/05
メディア: 単行本（ソフトカバー）
購入: 6人クリック: 33回
この商品を含むブログ (18件) を見る

とりあえず今やってるもの、これからやろうと思っているものを列挙してみた。 Keep it up!!