026-学习笔记:影刀RPA下的列表与字典

大家好,我是小洛哥,一个刚刚开始每天写作的新人。

影刀 RPA 下的列表与字典

今天除了例行工作外,打算好好分析一下小红书项目的对标账号,可面对那么多的账号和笔记,有点无从下手。

于是就想到了影刀 RPA 去采集,于是新建应用,开始搞。在其中又再次使用到了列表和字典的概念。记得第一次对这俩词有清晰的认知时还是 3 月份 RPA 航海。

后续在用的时候总是把这俩搞混,这次既然又用上了索性了解透彻。

发现用 AI 做知识问答整理真方便啊!(下面内容是 AI 生成经过我口语化润色的)

一、两者有什么区别?

列表与字典是 Python 中常用的两种数据结构,它们各自有各自的特点:

  1. 列表是有序的对象集合,字典是无序的键值对(键: 值)集合。
  2. 列表元素使用索引进行定位,索引是从 0 开始的整数;而字典元素使用唯一的「键」进行定位,键可以是任意不可变的类型,如字符串、数字。
  3. 列表的元素不需要是唯一的,字典的键必须是唯一的。
  4. 列表的创建语法是方括号 [],字典的创建语法是大括号 {}

二、相互嵌套

在列表或字典中,你可以嵌套任何类型的元素,包括列表、字典等。下面是一些示例:

  1. 列表嵌套字典的例子:
    [{"姓名": "张三", "年龄": 20}, {"姓名": "李四", "年龄": 25}]
    这个列表中有两个元素,每个元素都是一个字典,表示一个人的信息。
  2. 字典嵌套列表的例子:
    {"姓名": ["张三", "李四"], "年龄": [20, 25]}
    这个字典中有两个键值对,每个值都是一个列表,表示多个人的同一种信息。

三、自我嵌套

自我嵌套是指某个数据结构中嵌套了与其相同类型的元素。

  1. 列表自我嵌套的例子:
    [1, 2, [3, 4, [5, 6]]]
    这个列表中一共有三个元素,第三个元素还是一个列表。
  2. 字典自我嵌套的例子:
    {"姓名": "张三", "信息": {"年龄": 20, "所在地": {"国家": "中国", "城市": "上海"}}}
    这个字典中有两个键值对,第二个键的值还是一个字典。

注意:在处理嵌套的数据结构时,需要注意每一级嵌套的访问方法。通过逐级访问,我们把嵌套的数据结构理解成多层的楼房,每一层楼都需要通过特定的“门”(对应字典的键或列表的索引)来进入。

四、日常应用

学而不用是为贼,把我理解的 RPA 上应用的方法说一下。

在数据采集过程中,比如我采集小红书某个博主的全部笔记。

如果需求是单一数据,比如我只需要笔记链接,可以直接「获取相似元素列表」的链接地址,这样就是一个 [url1,url2,url3] 的列表了。

如果需求是多个数据,比如需要笔记的链接和标题,可以通过「获取相似元素列表」的元素对象,然后在「ForEach 列表循环」中用「获取元素信息(web)」去获得文本或链接,这样可以获得单一的 url1url2url3,以及 title1title3title3。接着可以用:

  1. 先用「新建字典」-「设置键值对」,分别获得 3 个字典
{`标题`:title1,`链接`:url1}
{`标题`:title2,`链接`:url2}
{`标题`:title3,`链接`:url3}
  1. 再用「新建列表」-「列表插入一项」,将上述 3 个字典,组合成一个列表:
[{`标题`:title1,`链接`:url1},{`标题`:title2,`链接`:url2},{`标题`:title3,`链接`:url3}]
  1. 当然也可以搞成下面这种形式,关键看自己是要用什么方法来处理这个数据了。
{`标题`:[title1,title2,title3],`链接`:[url1,url2,url3]}

把这两个东西搞明白了,在用 RPA 采集这块就清晰多了,果然不懂技术搞这玩意还是有点吃力的,有时间的话真要好好学一学 Python。


今天是保持日更 100 天目标的第 26 天,你很棒,继续保持,加油!

今天是坚持运动的第 17 天,在家跳绳 20 组!

——2024/05/11