データ分析初心者の備忘録

業務の幅を広げようとデータ分析の勉強をしています。このブログでは勉強した内容を不定期で更新していきます。

Rで自然言語処理(の準備)

統計ソフトのRを使って自然言語処理をする際に必要な設定のメモです。(インストール方法などはよく忘れてしまうため。。)

 

手順は以下の通りです。なお、Windows7の場合を想定しています。

  • Rのインストール
  • Rstudioのインストール
  • MeCab(形態素解析エンジン)のインストール
  • RMeCab(R上でMeCabを使うためのパッケージ)のインストール
Rのインストール

以下にあるRのダウンロードサイトから インストーラをダウンロードできます。

https://cran.ism.ac.jp/

Download R for Windows>baseの手順で最新版が手に入ります。なお、過去のバージョンを入手したい場合は「Previous releases」から入手可能です。

 

Rstudioのインストール

以下のRstudio公式ページから「Download」を選択してダウンロードできます。こちらもインストーラ形式なので苦労しないです。

www.rstudio.com

 

MeCabのインストール

以下のサイトで「mecab-0.996.exe:ダウンロード」をクリックするとインストーラがダウンロードできます。

http://taku910.github.io/mecab/

なお、MeCab京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです。 また、平均的に ChaSen, Juman, KAKASI (いずれも形態素解析エンジンの一種) より高速に動作します。 ちなみに和布蕪(めかぶ)は, 作者 (工藤拓) の好物です(ダウンロードサイトより一部引用)。

 

コマンドプロンプト上で動くので、システム環境変数のPathを通す必要があります。

 

マイコンピュータ>プロパティ>詳細設定>環境変数>Path で設定が可能です。自分のPCでインストールした場所を追加する (デフォルトではC:\Program Files\MeCab\bin)。

 

コマンドプロンプトを開き (スタートメニュー>ファイル名を指定>cmdと入力) 、mecabと打ち込んでMeCabが起動すれば正しく設定できています。試しに「すもももももももものうち」を入力すると、ちゃんと分解できます。

f:id:kuze3110:20161106223612p:plain

 

RMeCabのインストール 

 Rstudioを起動し、コンソール上で以下のコードを実行すればインストールできます。

install.packages("RMeCab", repos = "http://rmecab.jp/R") 

これで準備完了です!

「トップ1%に上り詰めたいなら、20代は"残業"するな」感想

「トップ1%に上り詰めたいなら、20代は"残業"するな」を読んだので感想文を残しておきます。

https://goo.gl/gCgwps

 

【ジャンル】

ビジネス

【対象読者】
20代(あるいは30代など若手)の社会人

【内容】
自分の人生の舵取りは自分ですることが必須である。舵取りのための情報収集のためであれば人に意見を聞いても良いが、舵取り自体を人に委ねてはいけない。
人が死ぬ時に後悔する事の多くは「自分の好きなように生きなかったこと」だという調査結果も出ていることからも、自分主体で生きることが如何に大切かは明らかである。
では、自分の人生を楽しく自分の生きたいように自由に生きるにはどうすればいいのか?
本書では社会人として今後長い時間を過ごしていく上での20代の過ごし方について、「戦略」「仕事」「人間関係」「勉強」「逆境」「人生」という切り口から実践的なアドバイスが書かれている。

【個人的に読んでいて興味深かった点について】
1.論理思考よりも直感が大事なのではないか
神経学者アントニオ・ダマシオによるソマティック・マーカー仮設(感情が効率的な意思決定を助けているという仮設)について言及した上で、昨今の論理思考ブームで論理思考に偏りすぎることは考えものだとしています。
直感を大切にする考え方や、制約を外して直感の向くままに頭に浮かぶ内容を書き出していく「ゼロ秒思考」とどこか通ずるものがあるのではないかと思いました。

2.自分の能力を高めるより、自分の活きる文脈に自分を置くこと
島田紳助のお笑い芸人としての戦略を例に、自分の特性を理解した上で自分を適切にプロデュースすることが大事だと言っています。
自分の能力を高めようと努力する前に立ち止まって立ち位置を見直す、(もしできるなら)変えるといった選択肢はあまり浮かばなかったので参考になります。

3.教養ブームの落とし穴
教養って本当に必要なの?という素朴な疑問に対する一つの回答が示されています。

4.独学が最強
歴史的発見や発明をした偉人たちは高校に通っていなかったり、成績が平均以下であったりしたそうで、偉大な成果は独学で得た知識から生み出されたそうです。
誰もが通る学校のカリキュラムでなく、自分で独自に勉強した内容こそが人と違った成果につながるのかもしれません。

他にも印象的な部分が多々ありましたが、この辺でやめておきます。
若手の社会人が自分の人生を生きる上での会社との付き合い方、仕事の見極めや進め方などにおいて参考になる書籍でした。