关于数据挖掘:使用NLTKdownload时出现的问题

应用NLTK.download()时呈现的问题如下:

  • 解决办法:*
    原本NLTK能够通过简略的nltk.download()下载所须要的文件,然而,这会呈现网络问题,十分慢,甚至间接连不上。所以咱们须要离线下载nltk_data。

一、下载数据文件

官网数据在https://github.com/nltk/nltk_…中,不过,在github上下载文件也挺慢的。所以,这里咱们能够去码云上找到对应的我的项目https://gitee.com/qwererer2/n…(链接如果生效能够在码云自行搜寻nltk_data)。 下载失去nltk_data-gh-pages.zip文件。

重点: 别忘了你是把整包都下下来了(咱们须要的是其中的package),要把解压进去的文件夹package挪到对应的nltk搜寻目录下。并且将packages文件夹重新命名为nltk_data。(我在这里被坑了)

二、将nltk_data文件夹移到对应的目录

nltk的搜寻门路为:

import nltk
nltk.find(‘.’)

Searched in:

‘C:\Users\15839/nltk_data’
‘E:\python_env\nlp\nltk_data’
‘E:\python_env\nlp\share\nltk_data’
‘E:\python_env\nlp\lib\nltk_data’
‘C:\Users\15839\AppData\Roaming\nltk_data’
‘C:\nltk_data’
‘D:\nltk_data’
‘E:\nltk_data’
将nltk_data文件夹移到上述任意文件门路即可。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理