编程宝库 - 技术改变世界

编程宝库

Python编程技术

怎么提取Playwright录制文件中的元素定位

最近组内推行Playwright进行自动化测试，由我封装了一个简单的框架供大家使用。本意是想让大家使用Page Object模式来编写自动化代码的，可是不知道是因为大家嫌麻烦，还是Playwright自带的录制工具太好用，基本上都是先录制，再把录制好的脚本放到框架中执行，结果就是Page Object的优势完全没有享受到，另外我在页面操作中加入了自动等待、重试等优化机制也是，还得在脚本里面一个个处理。由此，我分析大家不愿意用Page Object的一个原因是自己编写元素定位比较麻烦，而录制下来的脚本里面已经包含了定位信息，那么我是不是可以将录制脚本中的定位信息解析出来，在转换成我框架里的页面基类，就可以直接使用了。

方法研究

首先我想到使用读取python文件配合正则表达式的方式进行解析，但是仔细一想，如果一个表达式有多行的话就很难处理了，还需要分析语法进行拼接。后来查询到可以使用python自带的ast库将python文件转化为抽象语法树进行解析，一下子就豁然开朗了。

元素定位是元素交互的前提条件，也是自动化测试最重要的步骤之一。元素” 存在 “页面”中，要定位元素，就是调用“页面”的方法:

querySelector(engine=body) # 选择单个元素
querySelectorAll(engine=body) # 选择多个元素
waitForSelector(engine=body) # 选择单个元素，并且自动等待到元素可见、可操作

提取代码

我这里主要用到了ast的 parse walk dump 三个方法， parse 方法将脚本转化为抽象语法树， walk 用来遍历整个抽象语法树（类似xml遍历）， dump 用于调试和将无法解析的内容直接输出，其实这里可以使用 unparse 或通过 lineno col_offset end_lineno end_col_offset 这四个属性定位到源码，但是这些都需要较高的python版本才有，我现在项目中使用的python 3.7版本中还没有这些，只能先用 dump 代替（当然，也是我比较偷懒）。代码如下：

import ast
from inspect import signature

from playwright.sync_api import Page

import_num = 0
dup_num = 0
result = []
with open('<playwright录制脚本>', 'rb') as f:
  root = ast.parse(f.read())
parse_methods = set()
for i in dir(Page):
  if not i.startswith('_'):
      attr = getattr(Page, i)
      if callable(attr):
          sign = signature(attr).parameters
          if 'selector' in sign:
              parse_methods.add(i)
for node in ast.walk(root):
  if isinstance(node, ast.Call):
      if isinstance(node.func, ast.Attribute) and \
              node.func.attr in parse_methods:
          if len(node.args) == 0:
              continue
          selector = node.args[0]
          if isinstance(selector, ast.Str):
              selector = selector.s
          elif isinstance(selector, ast.Name):
              selector = f'变量: {selector.id}'
          else:
              selector = f'无法解析: {ast.dump(selector, False)}'
          frame_locator = None
          if isinstance(node.func.value, ast.Call) and \
                  isinstance(node.func.value.func, ast.Attribute) and \
                  node.func.value.func.attr == 'frame':
              if len(node.func.value.args) > 0:
                  frame_locator = str(node.func.value.args[0])
              else:
                  frame_node = node.func.value.keywords[0].value
                  if isinstance(frame_node, ast.Str):
                      frame_locator = frame_node.s
                  elif isinstance(frame_node, ast.Name):
                      frame_locator = f'变量: {frame_node.id}'
                  else:
                      frame_locator = f'无法解析: {ast.dump(frame_node, False)}'
          for i in result:
              if selector == i[0] and frame_locator == i[1]:
                  dup_num += 1
                  break
          else:
      result.append((selector, frame_locator))
              print(f"{selector}, {frame_locator} {node.func.attr == 'query_selector_all'}")
              import_num += 1
print(f'成功解析{import_num}条定位信息, 跳过{dup_num}条重复信息')

代码解析

代码中很多地方用到了 isinstance 方法来判断节点是什么类型，因为需要解析的内容都是 page.click('...')或 page.frame('...').click('...')形式，所以大多数时候需要提取 Call对象的 func的 attr属性即为所需要的定位信息。另外使用了 inspect 库来提取可能需要解析的方法，如 click fill等，直接从Playwright中提取，就不需要一个一个去找了。再加上一些重复判断，即为上述代码。

希望有了将录制脚本转换Page Object的方法之后，可以将Page Object的模式在组内推广起来吧。

关于如何提取Playwright录制文件中的元素定位信息的文章就介绍至此，更多相关提取Playwright元素定位内容请搜索编程宝库以前的文章，希望以后支持编程宝库！

下一节：Python字符串编码转换encode和decode的用法

Python编程技术

我们知道，最早的字符串编码是 ASCII 编码，它仅仅对 10 个数字、26 个大小写英文字母以及一些特殊字符进行了编码。ASCII 码做多只能表示 256 个符号，每个字符只需要 ...

Python Playwright 如何保持登录状态

Python字符串编码转换encode和decode的用法