课程: Excel 中的 Python
免费学习该课程!
今天就开通帐号,24,700 门业界名师课程任您挑!
通过Power Query处理外部数据
由于 Excel 中的 Python 功能限制, 我们不能在 Python 单元格中, 通过代码直接访问网络或者是本地文件。 那么,如何让 Python 代码 访问外部数据呢? 在上个视频中我们看到, 可以通过名称引用的方式, 获取某个数据区域或者是表格中的数据。 实际上,这个名称也可以是 Power Query 查询。 这样,我们就可以借助 Power Query 强大的 数据连接能力来获取外部数据。 在这个视频中,我们来了解一下, 如何通过 Excel 中的 Python 来获取 Power Query 中的 查询数据。 你也可以打开“练习文件>01_04”, 我们一起完成这个视频的学习。 可以看到这是一个 空白的 Excel 工作簿。 首先,我们来打开“数据”选项卡, 然后点击“从文本/CSV” 按钮。 接下来,找到我们的“练习文件”文件夹, 选中“发货数据”这个 CSV 文件, 把它导入进来。 需要注意的是,这个文件的原始格式, 是 UTF8 的格式。 接下来,点击“加载”按钮。 在“查询&连接”窗格中,我们可以看到, 当前我们已经建立了 和这个 CSV 文件之间的连接, 查询的名称就叫“发货数据”, 一共有 429 行。 同时,这个查询中的数据也加载到了 “发货数据”这个工作表, 而这个表格的名称也是“发货数据”。 可以看到,在这里有“订单 ID”、 “产品类别”、“发货日期”、 “地区”、“省份”、“运输方式”、 “运货商”和“运费”这些字段。 接下来呢,我们打开”工作表 1“。 这是一个空白的工作表, 我们点击 A1 单元格, 然后输入公式“=py(”, 我们进入Python 单元格的 编辑模式。 接下来,我们手动地输入“xl(〞”, 这时,会弹出两个选项。 下面这个带表格图标的 是目前加载到 Excel 中的表格, 我们要选择带(…)图标的发货数据。 按 Tab 键确认。 从实际的引用名称可以看到, 我们现在使用的是“发货数据”这个查询。 好,那接下来, 我们使用 Ctrl+Enter 来提交 Python 代码。 我们得到了一个 DataFrame。 打开“显示”卡, 可以看到,这是一个 429*8 的 DataFrame。 接下来,我们可以利用 Python 代码 对这个数据集进行操作。 在这里,我要对代码进行简单的修改。 我要定义一个变量…
随堂练习,边学边练
下载课堂讲义。学练结合,紧跟进度,轻松巩固知识。