可长期实习,弹性实习时间,可在学校处理任务
1.根据需求按照既定规则从指定的网页中获取需要的信息,丰富数据源;
2.协助维护爬虫系统的及时更新;
3.优化爬虫系统的性能;
岗位要求:
1.了解web技术,实现对各种网页的获取和解析;
2.计算机相关专业,至少精通Java、python、php中的一种开发语言,熟悉windows或Linux平台的使用;
3.能够克服动态网页加载、服务器跳转、登录验证等困难,获取指定的信息;
4.熟悉多线程、网络编程,精通网页抓取原理及技术,熟悉正则表达式,能从结构化的和非结构化的数据中获取信息;
5.爱好web技术和数据,能够不断的学习和探索;