入門自然言語処理を読み始めて環境構築まで on Mac OSX(10.7.2)

   

追記2012.1.15 個々でやったことを実行しても、一部うまくいかない部分があったのでやりなおしました。
【最終版】MacBookAirで入門自然言語処理の環境構築まで

pdf(1_593ページ)

いきなりコケたので備忘録がわりに。

環境MacBookAir
この Mac について

3ページ目にしてコケる(笑
とりあえず環境が整っていない。nltkがインストールされていないので、ここを参照してインストールする。

このページからダウンロードするのは
PyYAMLとnltkのdmgファイル。

インストールまでの流れ(消えると困るので引用) 

PyYAMLをソースからコンパイル.


$ tar
-zxvf PyYAML-3.09.tar.gz
$ cd
PyYAML-3.09
$ python setup
.py build
$ sudo python setup
.py install



NLTKは.dgmをそのまま実行し,インストール完了します.
ターミナルから,import nltk とするとインポートできるはずだったんですが,


$ python
Python 2.7.1 (r271:86882M, Nov 30 2010, 10:35:34)
[GCC 4.2.1 (Apple Inc. build 5664)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
Traceback (most recent call last):
 
File "", line 1, in
ImportError: No module named nltk
>>>


と怒られます.
公式をよく見てみると,

Troubleshooting

It is possible that the NLTK installer gives an error message like "Errors occurred. Try installing again." This may indicate that the NLTK installer could not locate a suitable version of Python on your machine, or that you have more than one suitable version of Python installed. In this case, open a terminal window, type cd /tmp/nltk-installer and then type sudo python setup.py install.


要は,適切な場所にNLTKがインストールされていませんので,ターミナルで手動でインストール完了してくださいということです.tmpディレクトリにnltk-installerがあるはずなので,そこからインストールします.


$ cd
/tmp
$ ls
-l
total
0
drwxr
-xr-x  9 root  staff  306  4 11 14:12 nltk-installer
$ cd nltk
-installer
$ sudo python setup
.py install

 これで環境構築はOK。


本に戻って
 pdf(36_593ページ)

一行目は大丈夫。
二行目 nltk.download()を実行するんだけど、全然進まないのは何故だ…

と思っていたら、ターミナルじゃなくて新しいポップアップがバックグラウンドで表示されてた(汗
しばらく気付かなくて、なんなんだ!と思ってしまったよごめん。

 book

bookを選んでインストールだ。
このインストールに何度かコケた。タイムアウトしてたっぽいので、何度かチャレンジ。
リストが全部真っ赤になって Status にout of  dateとか出ても、何度かやってみる。ダウンロードはちゃんと差分とってくれるので、心配ない。

これで1.1.2までの環境が整う。あとは読み進めるだけだ。

pdf(1_593ページ)

追記
P.7ですぐさま躓いたので追記。
 pdf(40_593ページ)

これできない。

必要なもの
git
numpy
matplotlib

gitはここからインストーラーをDLしてインストールで完了。
numpyはここを参照した
 

おすすめ記事一覧

 - Tips