利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?
发表于 2025-11-05 08:19:33
来源:
益强智未来  复制# 1、利用论岗位名称 job_name = dom.xpath(//div[@class="dw_table"]/div[@class="el"]//p/span/a[@target="_blank"]/@title) # 2、爬取聘信公司名称 company_name = dom.xpath(//div[@class="dw_table"]/div[@class="el"]/span[@class="t2"]/a[@target="_blank"]/@title) # 3、条运工作地点 address = dom.xpath(//div[@class="dw_table"]/div[@class="el"]/span[@class="t3"]/text()) # 4、维招工资 salary_mid = dom.xpath(//div[@class="dw_table"]/div[@class="el"]/span[@class="t4"]) salary = [i.text for i in salary_mid] # 5、出结发布日期 release_time = dom.xpath(//div[@class="dw_table"]/div[@class="el"]/span[@class="t5"]/text()) # 6、企商汇利用论获取二级网址url deep_url = dom.xpath(//div[@class="dw_table"]/div[@class="el"]//p/span/a[@target="_blank"]/@href) # 7、爬取聘信爬取经验、条运学历信息,维招先合在一个字段里面,出结以后再做数据清洗。云服务器利用论命名为random_all random_all = dom_test.xpath(//div[@class="tHeader tHjob"]//div[@class="cn"]/p[@class="msg ltype"]/text()) # 8、爬取聘信岗位描述信息 job_describe = dom_test.xpath(//div[@class="tBorderTop_box"]//div[@class="bmsg job_msg inbox"]/p/text()) # 9、条运公司类型 company_type = dom_test.xpath(//div[@class="tCompany_sidebar"]//div[@class="com_tag"]/p[1]/@title) # 10、维招公司规模(人数) company_size = dom_test.xpath(//div[@class="tCompany_sidebar"]//div[@class="com_tag"]/p[2]/@title) # 11、出结所属行业(公司) industry = dom_test.xpath(//div[@class="tCompany_sidebar"]//div[@class="com_tag"]/p[3]/@title) 1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.源码下载 |