关于自然语言处理:匿名函数和列表迭代及字典的计数集合排序使用

37次阅读

共计 1051 个字符,预计需要花费 3 分钟才能阅读完成。

# 匿名函数
    #lambda 是匿名函数的标记, 将 lambda 语句赋值给变量,则这个变量就成为了一个函数
    #冒号之前的形式参数 x,y,z 是这个函数的参数列表
    #冒号前面是这个匿名函数所蕴含的操作, 匿名函数后只能有一条操作语句
ceshi = lambda x,y,z: x*y
print(ceshi(3,4,5))
country = ['赵','魏','赵','魏','赵','魏','赵','魏','赵','魏','赵','赵','燕','燕','燕','齐','齐','楚','楚','楚','楚','齐']
#应用字典计数
Vac = {}
for i in country:
    if i in Vac:
        Vac[i] += 1
    else:
        Vac[i] = 1
print('构建出的词频数统计为:',Vac)
#统计每个呈现次数对应的单词的数量 key = 呈现的次数:value 该次数的单词总量, 也就是 有雷同词频的词的数量, 同时计算词的总数
ceshi = {}
counter = 0
for k,v in Vac.items():
    counter += v
    if v in ceshi:
        ceshi[v] +=1
    else:
        ceshi[v] = 1
print('构建出的具备雷同词频的单词数量散布为:',ceshi)
'''
sorted(iterable, key=None, reverse=False)  
参数阐明:iterable -- 可迭代对象。key -- 次要是用来进行比拟的元素,只有一个参数,具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序。reverse -- 排序规定,reverse = True 降序,reverse = False 升序(默认)。'''
#字典按值排序, 默认升序, 返回的是列表对象,dict.items() 是返回蕴含元组的列表,sorted 对这个进行排序操作 最初返回排序后果为一个列表
print('字典按值排序:',sorted(Vac.items(),key = lambda item:item[1],reverse=True))
#字典按键排序
print('字典按键排序:',sorted(ceshi.items(),key = lambda item:item[0]))
#列表对象的迭代
list_ceshi = [i for i in range(20,32)]
print('应用这种迭代形式,能够很简略地实现本表计算,异表地位匹配的工作')
for index,num in enumerate(list_ceshi):
    print(str(index)+u':',num)

最终的输入后果如下:

正文完
 0