当前位置: 高中信息技术 / 综合题
  • 1. (2022高二上·余姚期中) 小明搜集了某网络购物平台2021年1月1日至2021年9月30日时间段内的日用化妆品销售数据,原始数据如下图a所示。

    图 a

    1. (1) 小明对数据进行了整理,下列操作不恰当的是(   )(单选,填字母)。
      A . 发现记录中有6条重复,对这6条记录进行了删除 B . 发现记录中有38处数据项缺失,直接删除相关记录 C . 将某条记录中订单日期“2050-6-9”订正为“2021-6-9” D . 将某条记录中订单日期“2021#3#11”修改为“2021-3-11”
    2. (2) 图a 所示的数据为(A .结构化数据\ B .非结构化数据\ C .半结构化数据)
    3. (3) 小明发现数据中仍有极少量时间段外的记录混杂其中,利用Python 及pandas 模块进行处理。请回答问题:

      ①采用 pandas 模块中的 (单选:填字母:A .Series/B .DataFrame) 数据结构存储全部数据会比较高效。

      ②全部数据保存于变量 df 中,为筛选出订单日期为 2021 年第一季度内的所有记录,可以执行 Python语句 dfl=,则 dfl 中保存筛选结果。(单选,填字母。提示:多条件筛选时,条件之间用“&”连接,表示需要同时满足这多个条件)

      A.df[(df['订单日期']<='2021-1-1')&(df['订单日期']<='2021-3-31')]

      B.df[(df['订单日期']>='2021-1-1')&(df['订单日期']>='2021-3-31')]

      C.df[(df['订单日期']>='2021-1-1')&(df['订单日期']<='2021-3-31')]

    4. (4) 经过以上两步处理之后,为了解“所在地市”第一季度“订购数量”前 10 名的情况,编写如下 Python 程序段:

      #数据整理结果保存于变量 dfl 中,代码略

      g=dfl.groupby(“所在地市”,as_index=False).sum( )

      print(   ▲   )

      并生成图 b 所示的图表:

      图 b

      则划线处的代码可为(   )(多选,填字母)

      A . g.sort_values(“订购数量”,ascending=False)[0:10] B . g.sort_values(“订购数量”,ascending=True).tail(10) C . g.sort_values(“订购数量”,ascending=True)[0:10] D . g.sort_values(“订购数量”,ascending=False).head(10)
    5. (5) 根据以上数据整理结果,小明对第一季度所在地市的“订购数量”进行可视化处理,如图b所示。

      实现上述功能的Python程序部分代码如下,程序中划线处代码请填空。

      #按“所在地市”对第一季度数据分组并求和,再按“订购数量”升序排序

      #选取最后10 条数据,存入变量s,代码略

      import matplotlib.pyplot as plt

      x=s[‘所在地市’]

      y=

      plt.barh(x,y,color=r)

      plt.show( )

微信扫码预览、分享更方便