入門自然言語処理を読み始めて環境構築まで on Mac OSX(10.7.2)
追記2012.1.15 個々でやったことを実行しても、一部うまくいかない部分があったのでやりなおしました。
→【最終版】MacBookAirで入門自然言語処理の環境構築まで
いきなりコケたので備忘録がわりに。
環境MacBookAir
3ページ目にしてコケる(笑
とりあえず環境が整っていない。nltkがインストールされていないので、ここを参照してインストールする。
このページからダウンロードするのは
PyYAMLとnltkのdmgファイル。
インストールまでの流れ(消えると困るので引用)
PyYAMLをソースからコンパイル.
$ tar -zxvf PyYAML-3.09.tar.gz
$ cd PyYAML-3.09
$ python setup.py build
$ sudo python setup.py install
NLTKは.dgmをそのまま実行し,インストール完了します.
ターミナルから,import nltk とするとインポートできるはずだったんですが,
$ python
Python 2.7.1 (r271:86882M, Nov 30 2010, 10:35:34)
[GCC 4.2.1 (Apple Inc. build 5664)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
Traceback (most recent call last):
File "", line 1, in
ImportError: No module named nltk
>>>
と怒られます.
公式をよく見てみると,Troubleshooting
It is possible that the NLTK installer gives an error message like "Errors occurred. Try installing again." This may indicate that the NLTK installer could not locate a suitable version of Python on your machine, or that you have more than one suitable version of Python installed. In this case, open a terminal window, type cd /tmp/nltk-installer and then type sudo python setup.py install.
要は,適切な場所にNLTKがインストールされていませんので,ターミナルで手動でインストール完了してくださいということです.tmpディレクトリにnltk-installerがあるはずなので,そこからインストールします.
$ cd /tmp
$ ls -l
total 0
drwxr-xr-x 9 root staff 306 4 11 14:12 nltk-installer
$ cd nltk-installer
$ sudo python setup.py install
これで環境構築はOK。
本に戻って
一行目は大丈夫。
二行目 nltk.download()を実行するんだけど、全然進まないのは何故だ…
と思っていたら、ターミナルじゃなくて新しいポップアップがバックグラウンドで表示されてた(汗
しばらく気付かなくて、なんなんだ!と思ってしまったよごめん。
bookを選んでインストールだ。
このインストールに何度かコケた。タイムアウトしてたっぽいので、何度かチャレンジ。
リストが全部真っ赤になって Status にout of dateとか出ても、何度かやってみる。ダウンロードはちゃんと差分とってくれるので、心配ない。
これで1.1.2までの環境が整う。あとは読み進めるだけだ。
必要なもの
git
numpy
matplotlib
gitはここからインストーラーをDLしてインストールで完了。
numpyはここを参照した