当前位置: 高中信息技术 / 综合题
  • 1. (2023·浙江模拟) 2022年10月16日,总书记在第二十次全国代表大会上作了《高举中国特色社会主义伟大旗帜为全面建设社会主义现代化国家而团结奋斗》的报告,大会后全文发表。现将该报告内容存储在“new.txt”文件中,经程序处理后的数据保存为“newfc.txt”文件。分别如图a、图b所示。

    图a

    图b

    1. (1) 处理文件“new.txt”中的数据生成“newfc.txt”文件的过程,一般称为:
    2. (2) 编写如下python程序,读取“newfc.txt”文件的数据,并统计其中各词语(2个及以上汉字构成)出现的次数,在画线位置填写合适的代码,完善程序。

      import pandas as pd

      f = open('newfc.txt', 'r', encoding='utf-8').read()      #  读取文件

      words = f.split()        #利用空格、换行符将字符串 f 分割成列表

      counts = {}                       #  建立空字典,用于存放词语及其出现的次数

      for word in words:          #  统计其中各词语 (2 个及以上汉字构成) 出现的次数

          if  :

              if word not in counts:

                  counts[word] = 0

             

      #  利用字典生成相应的 Series ,根据值降序排列

      s = pd.Series( ).sort_values(ascending=False)

      for i in   :        #  从高到低输出出现次数最多的10个词语

          print(i)

微信扫码预览、分享更方便