当前位置: 首页 > news >正文

通过DrissionPage爬取Uniprot上的DNA-Binding点位

Uniprot

提供了蛋白质的很多信息。

DrissionPage

比起Selenium更强大的爬虫软件,Selenium已经被反爬而且配置困难。

Code

  • 输入是蛋白质的Uniprot ID TXT文件,一个id一行
  • 输出为CSV
from tkinter import W
from DrissionPage import Chromium, ChromiumOptionsimport csvdef write_csv(data):# 打开文件进行写入with open('output.csv', 'w', newline='', encoding='utf-8') as file:writer = csv.writer(file)# 写入表头writer.writerow(['id', 'DNA binding'])# 写入数据行for row in data:# 将列表转换为字符串,例如 "1,2,3,4"list_str = ','.join(map(str, row[1]))writer.writerow([row[0], list_str])# 创建配置对象(默认从 ini 文件中读取配置)
co = ChromiumOptions()
# 设置不加载图片、静音
co.set_browser_path(r'C:\Chrome_123.0.6312.59_x64.Green\App\chrome.exe')browser = Chromium(addr_or_opts=co)
tab = browser.latest_tab  ids=open('PDB2272_P.txt','r').readlines()
open_file=open('PDB2272_P_binding.txt','w+')data = [# [1, [1, 2, 3, 4]],# [2, [5, 6, 7]],# [3, [8, 9, 10, 11, 12]]
]for id in ids:id=id.replace('\n','')_list=[]tab.get(f'https://www.uniprot.org/uniprotkb/{id}/entry')  eles = tab.eles('@tag()=tr')for ele in eles:if ele.text.find('DNA binding') != -1:if ele.text.startswith('+'):txt=ele.text.split('\n')[0]print(id,txt.split('\t')[3])_range=txt.split('\t')[3].split('-')if len(_range)==1:_list.append(int(_range[0]))else:_list.extend(list(range(int(_range[0]),int(_range[1])+1)))if len(_list)>0:item=[id,_list]data.append(item)write_csv(data)
http://www.sczhlp.com/news/34319/

相关文章:

  • 2017做网站怎么赚钱seo网站推广软件排名
  • 网站搭建准备许昌seo推广
  • 专业电商网站建设软文代写新闻稿
  • 做那个网站比较好培训计划和培训内容
  • 旅行社网站开发上海企业网站seo
  • 苏州做网站推广西安网站托管
  • 广州十二区分布图优化设计方案
  • 做网站的公司怎么找客户广州网络公司
  • 宁波网站免费制作百度手机软件应用中心
  • 好题收录
  • google play/谷歌商店的网页替代品
  • 硅基聊天室——如何用supervisor优雅的管理服务进程
  • 新浦网站制作网站建设百度收录软件
  • 成都龙泉工程建设有限公司网站青岛网站推广关键词
  • 自己怎么搭建个人博客网站最新新闻事件摘抄
  • 成都网站建设龙兵科技微信营销和微博营销的本质区别
  • 网页设计遇到的问题及解决方案seo网络优化前景怎么样
  • 上海做个网站多少钱地推拉新接单网
  • 专门做进口零食的网站上海培训机构排名
  • 网站开发要哪些香港域名注册网站
  • 酒店预订网站建设百度搜索引擎怎么做
  • C++ 使用分治减小模板递归深度
  • 转塘有做网站的吗谷歌关键词排名优化
  • 做网站必须要数据库么友情链接交易
  • 国际建设管理学会网站网站快速上排名方法
  • app开发与网站建设站长统计app软件下载
  • 企业策划是做什么的广州seo团队
  • 无锡响应式网站建设seo怎么做?
  • wordpress如何配置伪静态页面海淀区seo搜索引擎优化企业
  • ins做甜品网站最近的重要新闻