震惊：selenium竟然不是自动化测试工具

转载

mb5fed716b639b4 2021-07-19 10:50:00

文章标签 css 测试工具自动化测试自动化工具 firefox 文章分类 代码人生

前几天看到有老外发微博说selenium不是自动化测试工具，在震惊之余我陷入了沉思，这种说法其实是有道理的，原来这个工具用了这么多年，这个隐藏的秘密我竟然一直没有发现。

很久很久之前，我在各种国外的测试论坛发现大家都在讨论一种新的工具：selenium，先入为主，由于在测试论坛最先产生的大范围讨论和关注，我一直把selenium当作是根正苗红的测试工具，这么多年来一直没有对这个观点产生过一点点的怀疑，哪怕selenium其实很多时候被人用作爬虫，很多时候被别有用心的人拿来做自动化的工具以获取不法收入，哪怕很多时候被用来做一些效率提升的工具，我都没有过一丝丝的动摇，在我心里，selenium就是最硬核的浏览器自动化测试工具之一。

震惊：selenium竟然不是自动化测试工具_自动化工具

直到最近几天不经意间看到有人说(以下内容来自机翻)

测试工具供应商能否请停止将他们的工具与 Selenium 进行比较！我厌倦了这个！Selenium webdriver 是一种自动化工具，而不是用于测试！当然，与非专业的测试工具相比，你开发的专门用于测试的测试工具看起来当然是很不错的了。拜托，歇歇吧。

看到上面的这条言论我才突然间意识到，selenium webdriver一直在不停的迭代，尽管速度很慢，但webdriver的各个版本里似乎总缺少点什么。于是有人总在搜索selenium的时候加上关键字pytest或者junit，于是我总是喜欢在面试的时候问你们用selenium的时候用的是哪个测试框架，于是专门有人写文章描述如何在断言里使用expected_conditions。这些证据都非常肯定的证明了selenium其实并不是专门为自动化测试设计的工具，selenium的核心是自动化工具，测试只是其应用的一部分场景而已，selenium明显格局更大，路走的更宽，真正掩耳盗铃的是我，我才是那个永远不能被叫醒的装睡的人。

渐渐的我意识到，怪不得我之前在公开课里演示selenium的应用时总是喜欢用selenium做爬虫的例子，怪不得我之前跟一些同学留的练习里，selenium扮演的角色也只是做效率提升的工作，比如每天签到之类，其实大部分时间我使用selenium只是把它当作是自动化的工具，测试真的只是我使用selenium的一个特别的场景，在这个场景里，一些工作变得很难，比如断言；一些情况我需要考虑的更多，比如各种环境和配置问题；一些问题变得很棘手，比如用例的修改速度往往赶不上页面重构的速度等等；我写selenium最有成就感，最得心应手，写着写着有点像读爽文的场景往往是

对爬取速度没有要求的爬虫
君子能不动手就不动手的场景，比如每天签到领金币

这些场景往往跟测试无关，与兴趣有关。

很久之前写的从知乎爬内容的selenium脚本，那时候firefox driver还是webdriver的自带驱动。

"""
从zhihu.com获取每日最热和每月最热
"""

from selenium import webdriver
from datetime import date

import sys
reload(sys)
sys.setdefaultencoding("utf-8")

class Zhihu:
 def __init__(self):
  self.daily_url = 'https://www.zhihu.com/explore#daily-hot'
  self.monthly_url = 'https://www.zhihu.com/explore#monthly-hot'

 def __enter__(self):
  self.dr = webdriver.Firefox()
  return self

 def __exit__(self, p1, p2, p3):
  self.dr.quit()

 def get_daily_hots(self):
  result = []
  hots_urls = self.get_daily_hots_urls()
  for url in hots_urls:
   result.append(self.get_answer(url))
  return result

 def get_answer(self, url):
  self.dr.get(url)
  # wrap_div = self.dr.find_element_by_css_selector('.zm-item-answer.zm-item-expanded')
  article = {}
  article['question'] = self.dr.find_element_by_css_selector('#zh-question-title').text
  article['author'] = self.dr.find_element_by_css_selector('.author-link').text
  article['answer'] = self.dr.find_element_by_css_selector('.zm-editable-content.clearfix').get_attribute('innerHTML')

  return article

 def get_monthly_hots(self):
  pass

 def get_daily_hots_urls(self):
  self.dr.get(self.daily_url)
  wrap_div = self.dr.find_element_by_class_name('tab-panel')
  title_url_elements = wrap_div.find_elements_by_class_name('question_link')
  assert len(title_url_elements) == 5
  urls = []
  for title in title_url_elements:
   urls.append(title.get_attribute('href'))
  return urls

class ZhihuReporter