已解决FutureWarning: Function get_feature_names is deprecated; get_feature_names is deprecated in 1.0 and will be removed in 1.2. Please use get_feature_names_out instead. warnings.warn(msg, category=FutureWarning)
文章目录
- 报错代码
- 报错翻译
- 报错原因
- 解决方法
- 千人全栈VIP答疑群联系博主帮忙解决报错
报错代码
粉丝群里面的一个小伙伴想用sklearn模块做关键字提取的时候,发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下::
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
a = ['一条小团团宣布复播','一条小团团最近怎么了','一条小团团停播文案','小团团突然宣布怀孕一条小团团停播了','一条小团团打的麻将叫什么','一条小团团停播各主播反应','一条小团团自曝曾被榜一','一条小团团停播真实原因','一条小团团停播努力的表情','一条小团团直播纹身事件','一条小团团早期直播视频一条小团团','一条小团团', '一条小团团', '一条小团团', '一条小团团', '一条小团团', '一条小团团', '一条小团团停播', '一条小团团', '一条小团团停播', '一条小团团', '一条小团团', '一条小团团', '一条小团团', '一条小团团', '小团团']
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(a)
X.toarray()
X.toarray().sum(axis=0)
data = {'word': vectorizer.get_feature_names(),
'tfidf': X.toarray().sum(axis=0).tolist()}
df = pd.DataFrame(data)
df.sort_values(by="tfidf" , ascending=False, inplace=True)
print(df)
报错信息截图:
报错翻译
报错信息翻译:
未来警告:函数get_feature_names已弃用;get_feature_names在1.0中已弃用,将在1.2中删除。请改用。
警告。警告(消息,类别=未来警告)
报错原因
报错原因:
由于sklearn模块版本更替的原因,get_feature_names函数已弃用,小伙伴按下面的命令修改即可!!!
解决方法
将代码修改为get_feature_names_out函数即可:
data = {'word': vectorizer.get_feature_names_out(),
'tfidf': X.toarray().sum(axis=0).tolist()}
再次运行程序成功: