Diary over Finite Fields

515ひかるの日記と雑文

Data Gateway Talk Vol.2に行ってきた

参加した

Data Gateway Talk vol.2 という勉強会に参加してきた。ブログ枠で参加したので書きます1

data-gateway-talk.connpass.com

会の趣旨

最初に主催の方からお話があったのですが、データ分析業務に従事している人がカジュアルにLTをするイベントで、データアナリスト/サイエンティストの登竜門(Gateway to Success)となることを目指す勉強会とのことです。非常にいい名前だなと思いました2

発表者も聴講者も若い人が多かったように思います。人の顔と年齢ってそんなに自明な関係はないので、あくまで印象でしかないですが。ちなみにわたしは26歳です。

会場提供: FiNC さん

勉強会に参加されたことのある方なら、会場スポンサーがなんかしらの宣伝とかをするのをよく見聞きしていると思います。今回の会場提供は FiNC さんというフィットネス支援アプリの開発・運営をしている会社さんでした。

今回スポンサーで発表されていたスガヤさん(漢字がわかりません、すみません...)という方の話が面白くて、聞き入ってしまいました。勉強会に出て人生について考えたのは初めてだった気がします。人生最後の10年をどのように過ごしたいか、そしてどのように過ごせるかは20代、30代の食生活や運動習慣とも密接に関係していて、遠い未来のことだけれども実はもう人生最後の10年の過ごし方に僕らは関与しているのだ、というメッセージは今まで聞いたことあるスポンサー発表の中でもかなり深いメッセージでした。実際 Twitter を見ていると FiNC アプリをダウンロードしました、と言っている方も何人かいました。

「居るだけで健康になれる会社」らしいです。会場でも少しだけ運動しました。

各 LT の感想

本題のLTです。発表者のお名前は connpass のページからとってきてます。資料へのリンクは僕が認識したものは掲載しています。今後更新するかは不明です。

結構長かったのと、懇親会でお酒を飲んだり、そんなにメモとれていない(ブログ枠なのにすみません...)割に現時点で資料が公開されているのか不明な発表がいくつもあるので、資料を見ないで書きます。変なこと、会場で言っていないことを書いているかもしれません。問題があればコメントとかTwitter(@515hikaru)とかでそっと教えてください。

ちなみに自分はコンサルティング会社で、受託で分析のコードを書いて、前処理・モデリング・評価のコードをいろいろと書いてきたエンジニアです。自社サービス会社の分析環境とかが全然想像できない(実例をあまり知らない)タイプの人類です3

数学出身でデータ分析をやっている人の話(瀧本 篤志)

数学科出身のコンサルタントの方の発表。データ分析やプロジェクトを進める上で数学がどんな風に活きているのかという発表。非常にアブストラクトな話ではあったと思うのだけれど、自分自身が数学出身であることと似たようなことを考えたことがあってしっくりきた発表でした。

データ分析のところで高度な数学を使ったりは別にしないんだけれど、数学を通して得た経験や思考の習慣が、顧客の言っていることの理解やタスクの明確化・構造化につながっているという話でした。

数学に限らず多くの学問や研究でそうだとは思うんですが、他人が納得するまで論理的に説明するという経験がたくさん積めるのが学問の場だと思います。その経験はやっぱり役に立っているなと自分も時折感じるので、思っていることをほとんどそのまま言ってくれたなぁみたいな発表でした。

管理栄養士からデータ分析(丹治朋子)

管理栄養士の方がデータ分析チームに入って四苦八苦したという話。会場提供もしてくださった FiNC さん所属の方。

プログラミングも数学や統計学の知識もないけれど、管理栄養士として FiNC のドメインに関する知識はあったので、技術力というよりはむしろドメイン知識で頑張っているみたいな話でした。

特に仮説のない場合と仮説を考えた場合でどのように施策が変わってくるかの例示はとてもわかりやすかったです。また経験談がコンテンツになっているようです。

tantan-growth.hatenablog.com

機械学習とUnityと可視化(k.yamada

んーと、すみません。僕にはあまりこの発表の要旨がわからなかったです。

現実にあるデータを仮想現実に持っていくみたいな話があって、現実に例えば企業のロゴがあって、それをアプリを通して見ると企業の情報が表示されるみたいなデモがあったと思うんですが、あまりどんなことができるのか、そして何が嬉しいのかのイメージがわたしにはわきませんでした。そのデモがすごいわけではない、ということはわかるし、たしかに見せてくださったシミュレーション動画はすごいなと思ったんですけど、モチベーションとかがイマイチつかめず。

あと可視化というと散布図とかヒストグラムとか、データ分析の補助のための可視化を思い浮かべていたのも原因かもしれません。データ分析をするための可視化というより、自動運転とかの目の前(現実)で機械学習モデルが動くような場面で、実際どんなような動きをするのかというのをシュミレーションで見せるという可視化だったり、現実におけるデータの仮想現実での可視化なのかなとこれを書いている今思いました。

契約書データとリスク予測のアプローチ事例(m.fujii

これが本当に面白かった。契約書という特定の文章群特有の問題に対していかに取り組んだかという話。

公平を期すために書くと、わたしは直近のプロジェクトでたまたま文書分類をやっていて、そこまで工夫する余地がなくて、あんまりNLPっぽくないしNLPのタスクとして人に話せることがないなーとか考えていたトコロでした。そんなことを思っている頭にこの話が舞い込んできたので、ものすごい刺さりました。

契約上のリスクがある・なしを予測したいのだけれどこの世に(おそらく)大量にあり、ニーズもあるにもかかわらずほとんど公開はされていない文書を相手にいろいろと工夫を凝らす話でした。

ミラーパターンという契約書だからこそ意味の抽出が難しく、かつ意味の理解のために重要なものを相手に格闘する話がメインだったのでした。ミラーパターンというものの詳細は資料を読んでいただくことにして、特定のドメインの課題に対してどんなデータを抽出すれば分析がうまく行くかの試行錯誤の過程の話は本当に萌えますね。これは例外なく。

重ね重ねですが、本当に面白かったです。

speakerdeck.com

データ分析とキャリアを見据える話(河合俊典)

ばんくし(@vaaaaanquish)さんのお話。先輩枠らしいけどおいくつかは知らない。

複数の会社で複数の役割を経験したことから、その会社のフェーズや状況によって必要な知識や技能、自分の性格や気質と合うかは変わるということをおっしゃっていました。そして、キャリアを見据えたとき、市場分析、企業分析、自己分析をやることが大事ですとも。

印象に残っているのは、面接官をやっていて多分本当はもっとやっているのに面接の場では話し切れない人が多いと。(転職活動のときは)採用面談で話しきるのがアウトプットであって、さらになんらかのフィードバックが必要だとも。ただそれは別に採用に限ったことではなくて、普段書いている技術的なアウトプットだったりとも同じだと。

自分の転職活動を振り返っても、正直よくない転職活動をしていたなと思います。ただなんとなく色んな会社の話を聞いて、でも正直働きたいとは全く思えなくて、すごい無駄な時間を過ごさせてしまったなと今は思っているところも正直あります。自分が無駄な時間を過ごしたことは自分のせいなのでいいんだけど...ただ、あの時間がなく今の職場、今の仕事を選べたのかと言うと多分Noで、自分がなぜどこも選ぶ気にならないのかという観点から、自分が求めている職場ってなにかを真面目に考え始めて、自然に自己分析が始まった気がします。すごい遠回りをしてしまったんだけど、たとえこの発表を転職活動中に聞いていてもそこには気づけなかったでしょうし。やれていない人ほど「俺はやっている」と思い込むものです(個人の感想です)。

だから初めて自分の言いたいことを採用面接の場で言い切れたし、それを出し切りたいと思えるほどのモチベーションが湧いた会社でなんか働けているのは幸運なことかなと思っています。あれ、なんで自分語りしているんだろう...

自分語りはともかく、資料の最後に書いてあった、

  • 最後にモノを形にする仕事≒成果
  • 実力≠成果

というのはつい技術屋の悪い癖が出てわたしは忘れがちなので意識したいですね。売れれば勝ち(極端な成果主義)だとも思わないけれど、モノがよければいい(ナイーブな実力主義)というわけではない。データサイエンティストであっても、実力があることと成果が出ることは同じことではないし、あんまり良い言い方ではないけれどいくらコードがきれいだとか品質の高い実験スクリプトが組めたからって、精度が良いとは限らないし精度が悪かったら没になってしまう可能性もあるわけです。品質の高いプログラムが書けても没になってしまったらそれは成果ではないわけで...

懇親会

つつがなく。

LTした人の話したいなとか思っていたと言えば思っていたんですが、なんか縁がなく話せませんでした。懇親会のときに動くの下手すぎるの一生治らなさそう。

まとめ

とりあえず初っ端に人間としての最後の10年を考えさせられ、最後に分析者・技術者としての今後の10年を考える機会になる良い勉強会でした。総じて満足度が高い会でした。

主催の方が Vol.3 をやらねば、とおっしゃっているので、期待しましょう!

資料が公開されるなどして、何か思い出すことがあればこの記事を更新するかもしれません。あと、なにかこの記事にフィードバックがあれば、おしらせください。


  1. どうでも良い話だから脚注に書くけど、ブログ枠で参加した理由はもともとこの勉強会の存在を認識していなくて、Twitterで宣伝を見た時にブログ枠しか空いてなかった。もともと7/5(金)は別の予定があり、参加できないなーと思っていたトコロその予定が直前の水曜にキャンセルになった。なのでちょうど1枠空いているし、ブログ枠参加しちゃうか〜と思って登録した。

  2. Gatewayというと最近高輪ゲートウェイしか思い出さないのですが、こんなことしか思いつかないのがなんか真面目にとらえていない人みたいで恥ずかしいです。

  3. 今回はブレインパッドの方主催ということもあるせいか、受託開発やコンサルティングの人も多かったですが普段は発表者も聴講者も自社サービス会社ばかりで全然話が合わないみたいなことがかつてありました。