<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網(wǎng)

      掃一掃關注

      當前位置: 首頁 » 企業(yè)資訊 » 熱點 » 正文

      盤點一個英文文本中統(tǒng)計關鍵詞的方法

      放大字體  縮小字體 發(fā)布日期:2022-12-07 18:08:24    作者:微生翼虎    瀏覽次數(shù):78
      導讀

      大家好,我是皮皮。一、前言前幾天在Python最強王者交流群【W(wǎng)endy Zheng】問了一個英文文本中統(tǒng)計關鍵詞得問題,這里拿出來給大家分享下。二、實現(xiàn)過程針對這個問題,感謝給出一個思路方法,也許有幫助,首先我們需

      大家好,我是皮皮。

      一、前言

      前幾天在Python最強王者交流群【W(wǎng)endy Zheng】問了一個英文文本中統(tǒng)計關鍵詞得問題,這里拿出來給大家分享下。

      二、實現(xiàn)過程

      針對這個問題,感謝給出一個思路方法,也許有幫助,首先我們需要將Excel中得文本進行導入到一個文感謝件中去,代碼如下:

      # coding: utf-8import pandas as pddf = pd.read_excel('./文本.xlsx')# print(df.head())# df['可以關鍵詞']for text in df['工作要求']: # print(text) if text is not None: with open('工作要求.txt', mode='a', encoding='utf-8') as file: file.write(str(text))print('寫入完成')

      接下來就可以針對這個文感謝件進行相關得詞頻統(tǒng)計了,如果你有自己自定義得關鍵詞,也可以就著關鍵詞去統(tǒng)計,沒有得話,就自己在關鍵詞范圍內(nèi),任意取多少個關鍵詞都可以,相關得代碼如下所示:

      from collections import Counterimport pandas as pddf = pd.read_excel('./文本.xlsx')# print(df.head())words = []with open('工作要求.txt', 'r', encoding='utf-8') as f: line = f.readlines() for word in line[0].split(' '): words.append(word)print(len(words))counter = Counter(words)# print(counter)# df['可以關鍵詞']for text in df['可以關鍵詞']: for k, v in counter.items(): if k == text: print(k, v)

      這個代碼對于英文文本還是適用得,不過有個小問題,如下。

      最后這里也給出中文分詞得代碼和可視化代碼,兩者結(jié)合在一起得,感興趣得小伙伴們可以試試看。

      from collections import Counter # 統(tǒng)計詞頻from pyecharts.charts import Barfrom pyecharts import options as optsfrom snownlp import SnowNLPimport jieba # 分詞with open('text_分詞后_outputs.txt', 'r',encoding='utf-8') as f: read = f.read()with open('stop_word.txt', 'r', encoding='utf-8') as f: stop_word = f.read()word = jieba.cut(read)words = []for i in list(word): if i not in stop_word: words.append(i)columns = []data = []for k, v in dict(Counter(words).most_common(10)).items(): columns.append(k) data.append(v)bar = ( Bar() .add_xaxis(columns) .add_yaxis("詞頻", data) .set_global_opts(title_opts=opts.TitleOpts(title="詞頻top10")) )bar.render("詞頻.html")三、總結(jié)

      大家好,我是皮皮。這篇文章主要盤點了一個英文文本中統(tǒng)計關鍵詞方法處理得問題,文中針對該問題,給出了具體得解析和代碼實現(xiàn),幫助粉絲順利解決了問題。

      最后感謝粉絲【W(wǎng)endy Zheng】提問,感謝【Python進階者】給出得思路和代碼解析,感謝【Python狗】等人參與學習交流。

       
      (文/微生翼虎)
      免責聲明
      本文僅代表作發(fā)布者:微生翼虎個人觀點,本站未對其內(nèi)容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔相應責任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

      粵ICP備16078936號

      微信

      關注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯(lián)系
      客服

      聯(lián)系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 亚洲美女在线观看播放| 2022国内精品免费福利视频| 国产又污又爽又色的网站| 男人和男人一起差差| 激情图片小说网| 无人视频免费观看免费视频 | 日本理论片午午伦夜理片2021| 在线a免费观看| 免费黄色在线网站| 久久久久亚洲av无码尤物| 天天久久影视色香综合网| 特级做a爰片毛片免费看无码| 扁豆传媒在线入口| 国产午夜激无码av毛片| 亚洲人成网国产最新在线| 99久久伊人精品综合观看| 精品久久久久久无码人妻| 日本一区二区免费看| 国产无遮挡色视频免费视频| 亚洲日韩亚洲另类激情文学| WWW四虎最新成人永久网站| 精品日韩欧美一区二区三区在线播放| 日本免费精品一区二区三区| 国产无卡一级毛片aaa| 久久精品国产亚洲香蕉| 性欧美激情videos| 旧里番yy6080| 国产日韩一区二区三区在线观看| 久久精品成人国产午夜| 五月婷婷中文字幕| 日本黄页网站免费| 国产成人一区二区精品非洲| 亚洲AV无码一区二区一二区| 日本亚州视频在线八a| 欧美三级全部电影观看| 国产精品久久久久久亚洲影视| 交换配乱淫粗大东北大坑性事| zoosk00lvideos性印度| 精品一区二区三区中文字幕| 少妇无码太爽了不卡视频在线看| 午夜啪啪福利视频|