職位描述
工作職責:
1.編寫抓取互聯(lián)網(wǎng)內(nèi)容的爬蟲。
2.數(shù)據(jù)抽取核心算法的編寫與優(yōu)化,提升爬蟲抓取效率和質(zhì)量。
3.抓取策略算法的更新維護,以及確保數(shù)據(jù)抽取準確、高效。
任職資格:
1.理工科專業(yè),本科以上學歷。
2.熟悉多線程、多進程、網(wǎng)絡通信編程相關知識;
3.有java平臺下網(wǎng)絡爬蟲開發(fā)經(jīng)驗,熟悉scrapy,WebMagic爬蟲框架,selenium動化測試及phantomJS;
4.熟悉JavaScrip、HTML、XML、CSS技術,熟悉網(wǎng)頁抓取原理及技術,熟悉正則表達式,從結構化的和非結構化的數(shù)據(jù)中獲取信息;
5.具有團隊合作精神,有責任感,對工作認真負責,有較強的協(xié)調(diào)和溝通能力。