大学院生のぼうびろく

自分の思考の記録とアウトプットがコンセプトです.留学/研究/プログラミング/統計/機械学習

2018年振り返り&2019年のこと

2018年の振り返り&2019年のことを書きます.

ここから得られる知見はないとおもいます.見る人は自己責任で.

 

--------------------以下,カレンダーを見て思い出して見た--------------------

2018年

1月: 某中学校高校で大学院生の生活に関する発表

2月: 記憶がない..(5月病?)

3月:大学の授業でデータ分析系の企業訪問

4月:しまなみ街道, AtCoderをはじめる

5月:記憶なし

6月:新しい研究テーマ開始

7月:オランダで学会発表(オーラル)

8月:論文データ大詰め

9月:論文執筆,短期インターン×2

10月:論文投稿

11月: ボストンキャリアフォーラム参加,研究で作ったIoTデバイス?を展示した.

12月: 論文リバイス,長期インターン(1ヶ月),某コンペ出場(現在進行系)

 

その他,ビジネスプランコンテストで受賞し,学長顕彰をいただきました.

プライベートではミャンマーの危険区域にいきました.

(自分は当日発表欠席しているので謎).

------------------------------------------------------------

2018年の大きなトピックは2点ありました.

1つ目は,今後のキャリアが決まりそうだということです.2つ目は,データサイエンティストとしての実績が作れなかったということです.

 

1つ目に関しては,2度の短期インターン,1度の長期インターン,ボスキャリを通じて自分のやりたいことがざっくりと定まりつつあるなと思いました.

ちなみに就職活動に関しては以下の本が参考になりました.

Amazon CAPTCHA

転職活動の本ですが,新卒で読んでおくべきだと自分は考えています.この本の中に「いつでも転職できる人材が留まっている企業が最強」というフレーズがありますが,まさにその通りだと思いました.新しい知見があったというよりは,「自分が考えていたことが言語化されている」といったほうが正しくて,とりあえず就活生の後輩や同期10人以上にオススメして買ってもらっています(自分で説明するのが面倒臭い訳ではない).

 

2つ目は,AtCoder, SIGNATE, Kaggle,統計検定一級などを空いた時間にやって何かしらの成果を挙げたいと考えていましたが,特に特筆した成果はあげることができずに2018年が終わりました.まず,SIGNATE, Kaggleに関してはソロでやってきたので途中で離脱してしまうことが多かったです.現在,チームを組んでコンペ出場中なので今度こそは成果を挙げたいと思います.AtCoderはSIGNATE,Kaggleと違って2時間で終わるのが良い点です.ただ,これもやりっぱなしになってしまうことが多く,より効率的に学んでいきたいと思いました.統計検定に関してはそもそもボスキャリと被って受けられませんでした.年に一回しか受験機会がないのはバグだと思うのでなんとかして欲しいです.

 

2点目に関して一つの気づきがあります.元々就職活動のためのスキルアップを目的に取り組んでいましたが,就活がほとんど終わった現状でもやる気が落ちていないので本心で取り組みたい内容なんだろうな,ということに気づきました.今年も頑張ります.

 

ツイッターにも書きましたが今年は以下の項目を達成したいと思います.

 

去年うまくいかなかった要因として,

○ 一人で取り組むことが多かった(妥協しやすい) .

○ アウトプットをあまりしていなかった(学んだことの消化不足)

などが挙げられるとおもいます.

 

アウトプットをあまりしていない要因として,データ分析界隈以外の結構いろんな人にツイッター(+それに紐づくブログ)がバレていて「めんどくせぇなぁ」と思った次第です.(どうやらリアルでは努力せずに強い感じのキャラでありたいらしい.)これもパフォーマンスが下がる一因になっている気がするので気にせずに色々発信していこうと思います.あと付随しますが,1ヶ月単位でやったことがあまり思い出せないのはアレなのでまとめる習慣もつけていきたいと思います.博士課程忙しいといいつつも,自分で完全に自由に時間を設計できる人生の数少ない機会だと思うので1日1日大切にしていきたいと思います.

 

まとめると2019年は人目を気にせず,怖がらずにアウトプットして成果を挙げる年にします.あとプライベートではアフリカにいきます.以上です.

 

 

 

 

ボスキャリ2018に参加してきました(長文注意).

ボストンキャリアフォーラム2018に参加してきました.

思いついたことを箇条書きに書いているので可読性は最悪ですがご了承ください.

 

※11/27 追記

"海外でリクルートスーツを着て没個性だという批判について"を追記しました.

 

対象読者:

○ ボストンキャリアフォーラム(以下,ボスキャリ)についてある程度知ってる.

○ 博士課程生.

○ 日本からわざわざボストンへ行く人.

上記のいずれかに当てはまる人.

 

基本的にネットサーフィンをしていて自分で得られなかった情報などを書いていこうかなと思います(なのである程度知っていることが前提です).博士課程で行っている人全体の5パーセント切っていると思うので身バレしそうですがまぁいいや.

 

ボスキャリの結論

外資系メーカー,ITを中心に3社内定.ポジションはばらばら.日系は最終を日本でする必要があるパターンでした.

DinnerのinvitationはDay0に1,Day 1に1,Day 2に3,Day3は0.

 

ボスキャリへ行った理由

○ 来年度留学するため日本の選考フローに合わない(日本にいない)可能性が高い.

○ ボスキャリ楽しそう(以前から漠然と行きたいと考えていた).

 

自分のスペック

○ 海外在住経験あり

○ 留学経験あり

○ 工学系の博士課程生(地方の大学)

○ 20卒4月入社希望

 

事前ヒアリング

ボスキャリで前年度無双していた知り合い3人ほどから話を聞きました.Dayからフルで空けとく,飛行機と宿を早く取る,企業のディナーがバッティングしたときのシミュレーションをしておくことを伝えられました.

 

事前準備

8月くらいからエントリー開始した(15社程度).事前にskype面接なども複数社入った.途中で何社か辞退&選考落ちしてボスキャリ当日にinterviewの予定が埋まっていた企業は5社程度.CFNのレジュメは,トビタテや学振などのスクリーニングのある試験突破している人なら同等のレベルのものを用意すれば書類はだいたい通ると思います.

 

ボスキャリの飛行機

Day0のAM2:00くらいにローガン空港着の飛行機に乗りました.しんどいのでおすすめしません.最悪でした.空港で寝ているボスキャリ勢っぽい人をいっぱい観測しました.

 

ボスキャリの宿

「金はいくら払っても良いから近い場所を選べ」という先人たちのアドバイスを完全に無視してUberで会場まで15分かかる一泊3000円のAirbnbを選びました(知り合いにはトータル4泊で15万円かけている人もいました.). 特に問題は感じませんでした.なるべく早く予約することをおすすめします.

 

ボスキャリでのUber活用

ボスキャリでは基本的にすべてUberを活用して移動していました.その際,Uber X(貸切)とUber pool(相乗り)が選べます.相乗りにすると貸切の1/3くらいの値段で済むのでコスパがよく,まただいたい乗ってくる人もボスキャリの人なので情報交換ができるというメリットがあります.一方で,相乗りはトラブルが発生する可能性が高くなるので大事な面接の前などはUberXを絶対に使った方が良いです.(実際に他の乗客がUberの運転手とトラブルになり,面接に遅れそうだったケースが1度ありました....).

 

※ クロークに預けるのが面倒だったのでコートは着ませんでした.外は寒いですが全く問題ありません.

 

ボスキャリでの連絡手段

Uberを活用するスタイルに決めていたのでポケットWifiを日本で借りてきました.会場内,Airbnbではwifiが使えるので要らないかなとも思いましたが借りて正解でした.ちなみに電話回線は持っておらず,企業との電話やりとりはインターネット回線での電話(050)で行なっていました.音が悪くて不便でしたが,大きな問題にはなりませんでした(可能であれば電話回線も契約しておいた方が良いです.).

 

ボスキャリ当日の持ち込み資料

○ CFNの参加証(これがないと入れないスマホアプリで代用可能)

○ レジュメのコピー(30部,詳しくは後述します)

○ 面接が決まっている企業の参加証

○ 電卓(必要とする企業があった)

○ パスポートのコピー(必要とする企業があった)

○ 日程表(Day0-Day3の予定が書き込めるようなスタイルの紙)

 

Walk-in用のレジュメ

ダメ元でWalk-inも出してみました.ネットでは「レジュメと履歴書は違う,履歴書をもっていくべき」や「A4ではなくA3」などと書いてありましたがよくわからなかったのでCFNのレジュメをそのまま印刷しました.やったこととしては

 ○CFNのレジュメをそのまま印刷(2ページになる)

   ○ホッチキスで止める

 ○顔写真を1ページ目にはりつける(こんな作業しなくてもよかったかも)

 ○メールアドレス,電話番号をボールペンで記入する.

をしました.15社程度Walk-inして3社から面接の連絡がきました.Walk-inの難易度が高いのかフォーマットが間違っていたのかは不明ですが,とりあえず渡す段階で弾かれることはありませんでした(それにしてもWalkinは同じ企業でおも難易度跳ね上がる気がします.基本的にはおすすめしません.).ちなみに事前で落ちた唯一の企業にWalkinを出したら通りました(笑)

 

Dinnerについて

Dinnerには複数の意図があるとおもいます.

①  選考 (食事中も選考)

②  相互理解や囲い込み(内定を出したあとでinvitationがある)

③  意思確認, 拘束(Dinnerに参加した段階で内定がでる)

あんまり探り合いながらご飯を食べるのが得意ではないので(笑),基本的にどのパターンにもよらず好きなことを質問したりしていました.立ち回りなどは全く考えていなかったのでそのへんは別のサイトで調べてみてください.ちなみにDay 3は企業の方も帰るのでDinnerに誘われる可能性は低いですがゼロではありません(最終選考をDay3にするケースでは十分にあり得る.後述しますが自分はDay3は観光していましたので招待されませんでした).

「内定が出ている第一志望の企業のディナー」と「行ったら内定が出る第二志望の企業とのディナー」のバッティングなどは結構難しい選択なので事前にシミュレーションしておいたほうが良いと思います(ちなみに自分は前者を選びました).

 

博士課程について

「そのまま同じ分野でR&Dしないの?」などの質問はされますが,特段Dだからといって相手企業に全く採用する意思がないようなことを感じた事はありませんでした.ボスキャリは良い意味で色々なバックグラウンドの方が揃っているので特に「Dだからこう」みたいなことはありませんでした.むしろポジティブに評価していただけたことが多かったと思います.ちなみに博士課程に限らず理系の方で「ボスキャリは文系用のイベント」だと勘違いしている方もいますが,エンジニアやデータサイエンス,R&Dのボジションを用意している企業もあるので一度調べてみるのがよいとおもいます.

 

面接について

英語面接のある企業もありました.また同じ選考フローなのに知り合いは英語面接で自分は日本語面接だったパターンもありました.面接の内容は基本的に自己PRの深掘りでした.ケース問題などもあるにはありましたが特に対策せずに受けました.ボスキャリの印象として「志望動機があまり聞かれないこと」がありました.ボスキャリには色々な企業が出展しているので企業研究や業界研究ができていないことを相手も分かってくれているのかもしれません(もちろん企業や業界によるとおもいます.)

やっていて良かったと思ったのが事前のスカイプ面接です.事前に色々な企業のスカイプ面接を受けているのでボスキャリ前までには面接力?は結構極まっていると思います.スカイプ面接なので移動コストもかからないし非常に効率的に対策ができたと思います.

 

日本からのボスキャリのためにわざわざ行くことについて

「なんで日本から来たの?」という質問に答えられるようにしたらOKです.賛否両論あるとおもいますが自分は行って良かったと思います.また日本から行っても受からない,海外大学の学生用のイベントというわけでもなく,準備していれば十分にチャンスがあるとおもいます.国内選考よりも密度高く就活を終わらせられるのでおすすめです.最初はペラペラで高学歴な海外大正規生にびびりますが,以外となんとかなります.たまに学歴でマウンティングされますが,あんまり気にしないで大丈夫です.

 

Day3について

就活イベントではありますがせっかくボストンにきたので観光はしたほうがよいとおもいます.Day3はほとんどイベントがないような状態なので観光しても良いと思います.中途半端にDay3になんとなく参加して内定もとれずにボストン観光もできないと勿体無い気もします.ボスキャリでの第一志望会社に内定したのでDay3の選考はすべて辞退して観光をしました.

 

他の人を見ていて思ったこと

もったいないなーと思ったことが何点かあるのでシェアします.

○ 説明会への参加

ボスキャリをどういう場所だと捉えるかにもよりますが,選考を受けることができる場所なので説明会にずっと参加しているのは時間が勿体無いなと思いました.説明会に参加しなくても調べれば事前にいくらでも情報がわかるので説明会に参加するとしてもピンポイントで知りたい情報を社員の方から聞く,くらいが良いと思います.

 

○ ボスキャリ会場でのレジュメの印刷,履歴書の記入

同じことをいうようですが,基本的にボスキャリ以外で事前にできることをボスキャリの期間中にやるのは勿体無いとおもいます.

 

海外でリクルートスーツを着て没個性だという批判について

うるせえ.僕らはご飯食べていかないといけないんです.リクルートスーツうんぬんはさておき良い機会だとおもいます.

 

後悔していること

ボスキャリは無法地帯です.19卒しか取っていない,海外正規生しか取っていない,文系のボジションしかない,と思ってもとりあえずアプライするとなにかしら良いことがあるかもしれません.実際に知り合いの交換留学生は正規生しか採用していない企業に内定していました.8割くらいの企業はダメだと思いますがダメ元で色々出してみるのが良いと思います.(海外で留学していた人なら無理難題をこじ開けるのは得意ですよね?)

 

まとめ

ボスキャリのコツは先人たちも言っているように準備することに尽きます.3日で内定と謳っていますが,事前準備含めると3日以上は絶対に必要です.ただ,準備するといっても国内の選考フローと比べると格段に時間を短縮できます.何か質問があれば気軽に連絡してください,

CyberAgentのアドテクコンペに参加してきました

CyberAgentのアドテクコンペに参加してきました.

サーバーチームとデータ分析チームの2人ずつのチームで

3日間でDSPを開発するコンテストでした.データ分析サイドで参加しました.

www.cyberagent.co.jp

 

上手くいかなかった経験は記録に残したほうが良いと思ったのと,

書いて良いよと言われたので書きました. 

 

参加したキッカケ

以前1on1面談会でお会いしたサイバーエージェントの人事の方に勧められて参加しました.チーム開発経験もなくgithubもちゃんと使ったことがないアレな人材ですが,なぜか受かったので参加させていただきました.

 

 

参加前

slackでグループが作られ参加する人が自己紹介していくのですがみなさん自己紹介が強そうすぎて終始震えていました.(ちなみに最年長でした.一番若い方で高校生だったので9才差でした笑)開発期間は短いのでslackでチームが決まって段階でオンラインやオフラインで話すなど色々できたなーと他のチームの話を聞いて今更思いました.

 

1日目

午前:レギュレーションの説明

高速な入札をどれだけ捌けたか

広告主の持っている予算の消化率

1クリックあたりのコスト

最終プレゼン

で順位が決定する感じでした.

 

データ分析チームとしては,

①クリック率(CTR)の精度を高める

②入札ロジックを考える.(どの広告主でいくら入札するか)

③サーバーサイドのことを考えてモデルの軽さも考える.

といったことが求められました.

 

午後: 開発開始

という感じでした.

データの特性をみるためにEDAしてベンチマークとして

ロジスティック回帰に特徴量ぶちこんでベンチマークを作ろうという話になりました.

そのあとxgboostに切り替えて精度をあげていくといきました.このあたりが全ての間違いでした.特徴量を丁寧に作ってロジスティック回帰で十分に勝てたと思います.

 

pythonでずっとEDAして可視化の際はメンターの方にtableauを教えていただきました.めちゃくそ便利でした.学生無料です.

 

2日目

精度が上がらなくなって色々試していましたが時間を溶かしてしまいました.振り返るとAUCをギリギリまであげようとしていましたが,今回はAUCをあげることが目的ではなく,コンペに勝つことが目的だったのにあまり周りが見えていなかったなという点が反省です.蓋を開けてみればAUCは全チーム似たような感じだったので入札ロジックにもっと時間を割けばよかったとおもいました.

 

3日目

プレゼン日+本番でした.なにもかもが間に合っていなかったので徹夜でチームで開発していました.せっかくホテルを取ってくださっていたのに本当にすみません,という感じでした.ほとんどベッドを使いませんでした笑

 

4時間の競技本番では,自分のチームが作ったDSPが入札を捌けていないことに気づきました.結局,作った機械学習モデルからルールベースの単純なモデルに急遽切り替えるという苦渋の決断をしました.メンターの方には「思考停止せずに代案をだして良いね」と言われましたが,2日間のサーバーサイドの頑張りを飛ばして本当に申し訳なかったです.(データ側のモデルに耐えうるサーバーをギリギリまで作ってくれていたので)また,DSPの対応でプレゼン資料を作る時間もなく反省点山盛りでした.

 

反省点

①サーバーサイドのことを考えずに重いモデルを採用してしまった点

 研究やkaggleでしか機械学習を用いないので「モデルの軽さ」を意識したことがなかったです.同じデータ分析でもkaggleで特徴量作りまくってアンサンブルしてーみたいな世界と全然違うんだなーという感想です.「AUC0.01しか上がらないならロジスティック回帰のほうがよくね?」という簡単な判断が何故できなかったのか謎です.

 

②精度にこだわりすぎた点

 ①とも関連しますが,AUCをあげることにリソースを割きすぎだったと思います.優勝チームとのAUCの差は0.01くらいでしたが,どのチームもAUCは似たりよったりでした.AUCをあげるだけのゲームではないので,なにが目的なのかをもう少し意識できれば良かったなーと思いました.

 

③結果のアウトプット

 仮説検証や特徴量抽出などは考えうることはほとんどやっていたのにスライドのアウトプットとしてなにも出せませんでした.「このチームは仮説検証力の評判が良い」と後でメンターの方々に言っていただけただけにもったいなかったと思いました.

 

 

感想

 わからないことだらけでしたが,聞けばなんでも答えてくれるメンターの方々がいて本当に良い環境でした.また,チーム開発をした経験がないので実際にサーバーサイドと連携する際に求められることなどが分かって非常に勉強になりました.サーバーサイドの基本的な予習をもっとしておけばより楽しめたかなーと思います.あと強すぎると思っていたメンターをしてくださっていた方々が1年目の新卒の方だということに途中で気づいて驚きました.また,3日間のインターンとは思えないレベルで人やお金やその他諸々のリソースが割かれている感じがしてすごかったです.インターンシップは2週間未満はお遊び,みたいなことを言う人を見かけますが無視でOKだとおもいました.まる.

DL4US2期受講します(内容のない報告).

DL4USを受講します.

宣言しておかないと途中で脱落しそうなので記録しておきます.

 

DL4US | Deep Learning for All of Us

・DeepLearningの無償のオンライン教育 プログラム

・2ヶ月間の集中プログラム

・東大松尾研が全面的にコンテンツ監修

 

受講動機

・Kaggleで画像系コンペは避けていたのでしっかりやりたい.

GPU持っていないという理由で逃げていたのでしっかりやりたい.

・MOOCが続かないので強制力があると良いなーと思ったので.

 

受講プロセス

一応,3期受験予定の方のために...

 

・ 受講申し込み(ES)提出 

そもそも,そんなに選抜されるとは知りませんでした(倍率10倍くらい?!).

MOOCとか色々あるのにやっぱり日本語なのが大きいんですかねー.

 

あと抽選とは言いつつ無作為ではないっぽいですね.

(以下のような記述がありました)

「 以下の情報は選考において利用しますので、正確にご記入ください。」

 

まだ運営側も試行錯誤中なので「確実に2ヶ月間完遂してくれそうな人」を選抜したのだと思います.私も,全体的に「機械学習は前から勉強していて研究やその他で使っているけどDeepだけ弱いから補強したい」のようなスタンスで書きました.後,githubしっかりと作っておくと良いかもしれません.

 

Python&Numpyのコーディング提出

分からなくてもググったら出てくるような基本的なことが問われますが,twitterの感じだと満点〜1,2問ミスまでしか許されなさそう. 

 

・合格通

2週間何もgithubいじっていないと除名.

課題が毎週ある.

大変そうですが最後までやり遂げたいです.

 

トビタテ等の書類に関する方法論(学振とかESも)

トビタテ9期募集中なんですね~.
アクセス解析をするとやっぱり書類に関する記事が読まれているので総まとめ.

(2018年2月18日加筆)
主にトビタテ側からのアクセス流入が多そうだったので学振についての補足を加筆.というか普通に分けて書くべきだった....

対象読者

申請書をどう書けば良いかわからない人.
出しているけどあまり通らない人.

学振補足:博士後期課程の学生が生活費とか研究費を貰う為の制度(正確には違うかも).
     トビタテと違い上位者は面接を経ずに合格する.

自分の今まで出した申請書
 トビタテ(5期合格)
 学振(DC1不合格)→(DC2面接免除合格)
 ビジコン(いっぱい出していっぱい通っていた.最近は飽きたのでやっていない.)
 その他色々

過去の記事も参照してください.
pondel.hatenablog.com
pondel.hatenablog.com


目次

〇モチベーションについて
〇モチベーションの注意点
〇自分でやること
〇他人にやってもらうこと
〇おすすめの書籍や方法論等
〇学歴とか関係あるの? (追記)

モチベーションについて

いきなり精神論からはじまりますが,受かる気で書きましょう.よく学振の申請書とかで「業績がないからとりあえず出す」みたいなノリの人ががいますが時間の無駄です.合否のフィードバックが得られるからとりあえず書けと指導教官に言われるかもしれませんが,十分な力を出さずに提出した場合,不合格の要因が「自分の努力不足」or「そもそものコンテンツが不十分」に分かれてしまうので敗因の分析がしづらいです.加えると,そんな文章を添削させられる人や推薦書を書かされる人が気の毒だと思います.

過去の有名な人もこんなことを言っています.

「競争は必ずしも速い者が勝つのではなく、戦は必ずしも
 強い者が勝つのではないことをわれわれは知っている」

絶対合格ラインと絶対不合格ラインの人以外は確率の戦いになるので自分から諦めないことが大切です.

モチベーションの注意点について

前の節でモチベーションを上げろ,とは言いましたが「そもそも通るのが不可能ではないか」は吟味したほうが良いです.文章のロジックを整えたり,魅せ方を変えることは掛け算のような仕組みになっています.足し算ではありません.どういうことかというと,
自分のコンテンツが100点だとして,文章を推敲することで1.5倍の150点までレベルを引き上げることは可能です.ただ一方で,自分が0点だとしたら,文章をいくら頑張っても0点のままです.

要は必要な最小限のスキルセットは保有しているか?ということです.
私が今から芸術系の会社に入ろうとして文章をこねくりまわしても多分不可能です.なぜならそもそも訴求できるベースとなるコンテンツがないからです.一方で,トビタテであれば学生であればOK.学振研究員についても「業績よりも将来性に重きを置く」らしいので文章を遂行して書類を通す努力をすることは時間の無駄ではなさそうです.
(※ちなみにDC2は業績が必要だと考えているのであればDC2業績なしで通った人をネットで探してみてください.多分いると思います.)

自分でやること

まず自分でやることですが,インターネットでのサーベイです.
例えば,トビタテ留学JAPANだったら,
 ・トビタテの合格ブログを読む
 ・トビタテの合格者の申請書を貰う
ができれば強いと思います.
(ブログは10件,申請書は3件くらい集めれば良さそう.人それぞれスタイルが違うのでなるべく数を集める.)
前者はインターネット上に落ちているので5件くらい目を通せばなんとなく勝ちパターンが見えてくると思います.後者は人によっては集めるのが難しいかもしれませんが,例えばツイッターとかでDMを送ってお願いしたらシェアしてくれる人もいると思います.こちらも複数サンプルを集めることによって,どう戦えば良いのかが分ると思います.せっかくのインターネット世代なので活用しましょう!笑
(※応用として,集めるのが困難ですが落ちた人のサンプルが貰えると非常に助かります.更に,不合格→次の年に合格,等のサンプルがあると最強です.(学振DC1不合格→DC2初年度面接不合格→DC2の2年目面接免除合格)とかあれば最強ですね.あるのか知りませんが.)

他人にやってもらうこと

他人にやってもらうことは「添削」です.
「お母さんに見ても分るように」という意見がありますが,お母さんに見せるのは恥ずかしいと思うのでマストではないと思います笑 自分はやったことありません.

添削は基本的には「その申請書で過去に受かった人,複数人に見てもらう」が鉄則です.
推薦で複数社落ちてボロボロだった先輩が後輩にアドバイスしているのを見て驚いたことがあります.
落ちた人に添削してもらっても到達点はあまり期待できないのでやめておいた方が良いと思います.
むしろ場合によっては害になることさえあります.
友達に見てもらったりする場合もありますが,みせても「いいんじゃね?」みたいなコメントで終わると思います.
これも根拠のない自信がつくだけです.

加えて,圧倒的に業績がスゴイ人も参考にならない場合が多いです.
前の例でいうところのコンテンツのレベルが1000点のような人のことです.
彼らはそもそものスペックが桁違いなので文章の遂行をせずに出しても受かります.
コンテンツ1000点×0.8(推敲の甘さ)でも800点あります.
彼らのレイアウトやアドバイスだけを参考にすると大惨事です.
(e.g. 自分は国際誌1報だけど5報ある段階で申請した先輩の申請書を参考にしてしまう.)
逆に言えば自分よりも業績がなくて通っている人は本当に参考になるとおもいます.

添削の理想の相手を再定義すると「異次元のスペックではなく,その申請書で過去に受かった人,複数人に見てもらう」になります
知り合いにそんな人いない!と言われるかもしれませんがインターネット社会なのでググってメッセージ送ればなんとかなると思います.あと添削してもらうときは礼儀は必要だと思います.合否に関わらず結果の報告はみんなしてほしいはずです.

ちなみに添削前にしてほしいことは「ググったら分ることは調べる」+「全部埋めてから出す」です.
「ここはまだ途中なんですけど~」みたいな感じのものを添削するのは非常に難しいと思う.
既にあるものを指摘・アドバイスするのは簡単だけど他者のために無から有を生み出すのはしんどい.これは個人差がありそう.

おすすめの書籍や方法論等

おすすめの書籍を紹介しても99%の人は買いませんが一応載せておきます.
文章作成について添削をしてもらっても対処療法にしかならないので長期的にみれば自分で原則をつかんでいた方が良いと思います.

数学文章作法 基礎編/推敲編
数学ガールの著者による文章の書き方.最初に読むのに適している. 
数学とあるが文章の書き方全般におすすめできる.

数学文章作法 基礎編

理科系の作文技術
理系文章のバイブル.理系以外もおすすめ.数学文章作法よりも難しい.

論理トレーニング101題
接続詞に圧倒的に強くなれる.理科系の作文技術よりも難しい.
(本ブログは流して書いているので多めに見てください.)

学振申請書の書き方とコツ DC/PD獲得を目指す若者へ
学振のまとめが書いてある.ネットでググれば出てくる内容ではあるが体系的なのでおすすめ.
できれば色々調べる前の初期段階で購入がおすすめ.

ロジカル面接術
文章そのものではなく,ESはどのような書き方をすれば良いのかがわかる.
就活用ではあるが,応用すれば他の申請書にも適応できる.


これらの本+αで自分が文章を書くときに気を付けているエッセンスが以下の通り.
分っている人には「何を当たり前のことを」と思われるかもしれないけど.

1. 文章は一義的に書く.
AさんとBさんが読んでいるのに違う解釈をしてしまうのは良文とは言えない.
20人の違う人が読んでも同じようにしか解釈できないような文章を目指す.
そうでないと審査員の引き方によって合否が揺らいでしまう運ゲーになってしまう.

2. 言われたことには言われた通りに答える.
例えば,「3年後までのキャリアプランを教えてください」という設問に対して
「3年後までだと400字埋められないから3年後まで+10年後までも書こう!」という解釈の仕方がある.
これだとA「こいつは10年先のことも考えているのか!すごいね!」ってなるパターンと
B「こいつ設問も読めないのか...アホなのかな?」となるパターンどっちが多いと思いますか?
人それぞれだと思いますが私はBのパターンの方が多いと思うので言われたことには言われたように答えます.

3. 根拠を示す.
数字・実績・他者からの評価(自分での評価はなんとでも言えるので他人からの評価を書く)を使って主張する.

4. 文字数制限いっぱいに埋める.
400字制限だったら最低8割埋める.なるべく390~400字の間.
たまに文字数制限なしのパターンがある.あれは知らない.適当にやる.
(※学振などのレイアウト自由の場合は見やすさ等別のファクターも出てくるので注意.詰まっていれば良いというわけではない.)

5. 結論から書く
面接官が自分の文章に興味のない前提で書く.後半いくら頑張っても1文目が面白くなかったらゲームオーバー.ストーリーではなく新聞のように.

学歴とか関係あるの? (追記)

トビタテも学振でもよく皆さんが疑問に思う内容だと思います.
トビタテだと学歴,学振だと学歴・研究室のボスの知名度などでしょうか.(ちなみに自分はどっちもフツーだと思います.)

個人的には「直接的な関係はない」というのが意見です.
学振でもトビタテでも合格者の統計データを見るとやっぱり上位大学の方が受かっています.
学振に関しては同じラボから毎年排出されている気がします.

これらも全部「直接的な関係はない」と考えています.
ここでいう「直接」とは学歴及びラボが強いと申請書が加点されるようなイメージです.
これはないと思います.
ただ現実的にデータとして出てくる要因はいくつか考えられます.

①申請書のストック数がケタ違い.
 冒頭で言いましたが申請書をどれだけ集められるかが勝負です.上位の人達は集めるコストが低い.

②添削してくれる先輩が多い
 フィードバックを得るべき先輩に関しても挙げましたが,そういう先輩と低コストで出会える確率が高い.

③受かると思って書いている.
 冒頭で「受かる気で書いてください」と言いました.上位大学やラボの人達は周りも受かっているので受かる気で書いているのに対して,周りで誰も受かっていない人は「落ちてもいいや,受かればラッキー」くらいのノリで書いている.そもそも出している母数も違うと思う.

④論理的思考力がある.
 文章はロジックです.日本の教育では文章の書き方について教わることはないですが,上位大学に行っている人の方が文章の論理構成を考える訓練ができているのかもしれません.

⑤システムが出来上がっている.
 特に学振の場合ですが,M2の申請前に論文が出るようにシステマチックに指導教官がラボ運営している場合はあるとおもいます.これが良いのかに関してのコメントは差し控えますが.(加えて学振では推薦書が必要です.受かっているラボの指導教官は抑えるべきポイントを分っているのかもしれません.)

これらの①~⑤の結果が申請書に反映されて結果的に通過率が高いのだと思います.
逆に言えば
①→コストかかるけどググって探す
②→コストかかるけどググって探す.
③→自信持つ
④→ちゃんとテクニカルライティングの勉強する
⑤→ラボに頼らず頑張る(笑)

で突破できるのではないでしょうか.


ちなみに以下は妄想ですが,学振において「ラボの力が直接的に影響がない」と考えるもう一つの理由が審査セットにあります.
学振は(確か)異なる領域の6人に採点される仕組みで自分の分野とかなりズレている分野に見られることになります.
自分の分野の人は当たっても1人です.

たまに,「審査員は学会で自分の発表みているかもしれないからアピールしましょう」みたいなこと言っている人いますが,これも怪しい.

1. 自分の審査セット6人のうち1人が自分の領域に所属している.
2. 1の人が自分と同じ学会で自分の発表を見ている.
3. 数十枚?の申請書を1枚数分で処理しないといけないような状況で学会での自分の発表を思い出してくれて大幅加点してくれる.

この1~3が成り立つ必要があり,かつ成り立ったとしても6人中1人の点数が上がるだけです.
ここに力入れるくらいなら申請書頑張るべきかと.

以上です.間違ったことを言っていたらすみません.
また何かあればコメントを下さい.

博士課程の就活(準備編)

博士課程の就活の情報があまりないので自分がやろうとしていることを記録.

後で振り返る.

筆者のスペック

・学部時代に就活をしていた(エンジョイ就活).

・工学系(非CS).ラボからは,CS系含めて博士で民間に行っている例はある.

・資格?:学振特別研究員,TOEIC800後半,英検準一級,統計検定2級

志望職種

・データサイエンティスト

・新規事業立案

・IT関係

考えているコト(懸念点)

・なるべく就活に時間は使いたくない(研究やその他のことに時間を割きたい).

・でも,就活を適当にするのとは別.

・とりあえず3年大企業の理屈はあやしい(学部卒のとりあえず3年ではなく博士卒のとりあえず3年は年齢的に取返しがつかない気がする.行きたい企業があれば大小関係なく決める.)

・大学のスキームでインターンに3か月行かせてそのまま内定パターンはいっぱいあるけど使う予定はない.(内定目的では行かない.スキル向上目的ならアリかもしれない)

・専門性がそのままいかせる職種ではないのでCS系のガチ勢と戦う必要あり?

実際にやること

・LABBASE

LabBase (ラボベース)|研究を頑張る理系学生のためのスカウト型就活サービス

理系のための就活サイト.修士博士用で忙しい学生のために設計されている.使えるかはわからないけど登録.(実際にオファーが来る.)

 

・アカリク

TOP - 大学院生(修士/博士)ポスドクの就職・転職情報サイト「アカリクWEB」

IT,データサイエンス,博士等のキーワードでセミナーや逆求人のイベントたまに開催しているのでチェック.本当は逆求人出れば良いのだけど敷居高そう...

 

WANTEDLY

Wantedly(ウォンテッドリー)「はたらく」を面白くするビジネスSNS

いるのかな?一応登録.IT系に特化してそう.LABBASEと違って自分からアプライするスタイル.

 

・ボスキャリ

キャリアフォーラム | CFN(CareerForum.Net)

ボストンで11月に開催されるバイリンガル用の就活イベント.バイリンガルの定義が不明.博士課程がそもそも必要とされているのか不明.自分の希望職種の選考があるのか不明.ただ,「この3日間で内定を1社でも取っておくと以降の就活で本当に行きたい企業だけに絞れる」という時間的メリットがでかい.ちなみに,なんでボストンなの?ってことですが,ボスキャリがキャリアフォーラムで最大規模なので他のキャリアフォーラムは「ボスキャリで埋まらなかった枠を埋めるためにある」らしい.なるべく可能ならボストンへ行ったほうが良いみたい.

 

・KAGGLE/オプトDSL

Kaggle: Your Home for Data Science

オプトDSL・DeepAnalyticsDeepAnalytics

なんだかんだ上記の就活サイトに出かけるよりも家にこもってスキルを上げたほうが良い気がする.現在,オプトの引っ越しコンペ36位/230位が最高スコアなのでこれよりももっと強くなりたい.

 

・統計検定

統計検定:Japan Statistical Society Certificate

アンチ資格のポジションだけど,取得したい.半分趣味.統計検定2級は取得しているけどこれをアピールするのは恥ずかしい.11月の1級に照準を合わせて準一級(6月)も取得していきたい(準一級は成績優秀者を狙うくらいでないと11月間に合わなさそう).就活に使えるかは不明.昨今のデータサイエンスブームも相まって準一級持っていたら10社に1社くらい興味持ってもらえるかな?くらい.期待はしていない.

※ちなみにTOEICのスコアの倍の労力がかかった英検準1級は見向きされたことがない.英語ガチ勢から評価されるにはIELTS,TOEFLだが就活においてはTOEIC一択.英検はあらゆる場面でいらない.

 

github/Qitta/blog

The world's leading software development platform · GitHub

Qiita - A technical knowledge sharing platform for programmers.

情報系に進む場合,github/Qitta/blogのリンクの提出が求められる場合がある.研究に関係することはオープンにできないので(bitbucketで管理)どうするか迷う.機械学習アルゴリズムをスクラッチで書く,とかは結構やってみたいことなのでちょっとやってみようかなとはおもう.

 

まとめ

研究で結果を出して,統計と機械学習のスキルを上げて,ボスキャリで決めて,というのが最善のパターンかもしれない.(うまくいくかはわからない.)

就活とか統計検定とか.

www.toukei-kentei.jp

統計検定の準一級(6月)と一級(11月)に受けようと考えているので忘備録です.

統計検定2級は試験前に問題集の過去問全部解いたら合格できましたが準一級と一級は結構厳しそう.モチベーションとTODOも兼ねてやることリストでも.

受検動機

・就活のため

・スキル向上

が主な目的です.ちょうど来年度に就職活動が始まります.志望分野にデータサイエンティストが入っているので統計検定を受けようと考えています.(統計検定という資格がそもそも就活の役に立つかは不明です.そもそも資格自体がクソだという意見もあるのでこれを第一のモチベーションにするとキツイ.TOEIC900近く,英検準一級と英語の資格はサチっているのでここでTOEIC950,英検一級に上げるよりはコスパの観点でも差別化の観点でも良いのかなと.(TOEFL受けろよっていう意見もありますが語学に時間ぶちこむのリスク高すぎる.))

ちなみに就活までの時間は1年ほどありますが,

1. 論文まじめに投稿する.

2. 統計検定準1級/1級合格

3. kaggle/オプトDSLコンペで結果出す.

くらいですね.やることは!超絶暇だったらTOEIC900台に乗せますが多分しません.

 

そういえばここまで書いて気づきましたが行く予定の就活イベントが統計検定1級の試験前にあるんですね...笑 まぁ準一級だけで特攻します.(というか誰も見ていない気がする.)

careerforum.net

 

統計検定ですが,一回準一級の過去問解いてみました.(2015年)

2級と重複するような内容もあって楽勝かなとも思いましたが(正規分布の考え方や実験計画法,ベイズ統計等),2変量正規分布自己回帰モデル,DW統計量,主成分分析など2級では求められない内容もありますね.ただ出題の範囲もあまり多くないので成績優秀者を目指して頑張ろうと思います.

 

・過去問解く(2015年度問題)

・過去問探す(2016年度誰かください笑)

・公式HPにアップしてある問題集を解く.

東京大学出版の青・赤・緑本の演習問題を解く

これ+東大本の範囲外の問題をググったりはじパタ読んだりすれば行けそうです.

 

問題が1級の方で何を言っているか分らない問題もちらほら.先ほどリストした準一級用のタスクをなるべく早く(今年度中)に終わらせてから1級の勉強にシフトしないと間に合わなそうです.