关于数据挖掘:使用NLTKdownload时出现的问题

33次阅读

共计 696 个字符,预计需要花费 2 分钟才能阅读完成。

应用 NLTK.download() 时呈现的问题如下:

  • 解决办法:*
    原本 NLTK 能够通过简略的 nltk.download() 下载所须要的文件,然而,这会呈现网络问题,十分慢,甚至间接连不上。所以咱们须要离线下载 nltk_data。

一、下载数据文件

官网数据在 https://github.com/nltk/nltk_… 中,不过,在 github 上下载文件也挺慢的。所以,这里咱们能够去码云上找到对应的我的项目 https://gitee.com/qwererer2/n…(链接如果生效能够在码云自行搜寻 nltk_data)。下载失去 nltk_data-gh-pages.zip 文件。

重点:别忘了你是把整包都下下来了(咱们须要的是其中的 package),要把解压进去的文件夹 package 挪到对应的 nltk 搜寻目录下。并且将 packages 文件夹重新命名为 nltk_data。(我在这里被坑了)

二、将 nltk_data 文件夹移到对应的目录

nltk 的搜寻门路为:

import nltk
nltk.find(‘.’)

Searched in:

‘C:\Users\15839/nltk_data’
‘E:\python_env\nlp\nltk_data’
‘E:\python_env\nlp\share\nltk_data’
‘E:\python_env\nlp\lib\nltk_data’
‘C:\Users\15839\AppData\Roaming\nltk_data’
‘C:\nltk_data’
‘D:\nltk_data’
‘E:\nltk_data’
将 nltk_data 文件夹移到上述任意文件门路即可。

正文完
 0