職位描述
崗位職責:
1.擔任中文自然語言處理,網頁內容結構化分析,信息抽取、命名體識別、句法詞法分析、文本分類、聚類分析,詞嵌入分析、用戶行為分析等技術的研發(fā)工作;
2.對互聯(lián)網海量信息挖掘、分析、處理相關最新技術與開源技術進行研究與分析;
3.作為核心研究人員加入公司產品線中智能計算與數據挖掘相關功能部分研發(fā);
4.負責公司產品中數據挖掘與統(tǒng)計分析模塊的研發(fā),為產品功能完善提供必要技術支撐;
5.開展與語義分析開發(fā)相關的新技術和發(fā)展動態(tài)的跟蹤和預研工作。
任職要求:
1.985/211院校計算機、電子工程、數學或統(tǒng)計等相關專業(yè)碩士及以上學歷;
2.有扎實的機器學習、模式識別、數理統(tǒng)計理論和工程技術基礎,有自然語言處理(NLP)項目獨立研究或工程經驗;
3.對自然語言處理、搜索平臺的架構、算法有濃厚興趣。精通1-3種算法,對于各類排序算法、動態(tài)規(guī)劃、圖論算法有深入理解并能靈活應用;
4.精通一門開發(fā)語言,Java、C/C++、Python,MATLAB Programing;
5.有科研精神和創(chuàng)新精神,優(yōu)秀的分析和解決問題的能力,對挑戰(zhàn)性問題充滿激情。
企業(yè)介紹
海量公司成立于1999年,是一家以海量互聯(lián)網數據為基礎的在線行業(yè)情報服務提供商,是國家認證的“雙軟企業(yè)”和“高新技術企業(yè)”,海量現有員工240人,研究生占30%以上。公司采取雙總部運營模式:天津公司定位為基礎開發(fā)和運營中心,北京公司為應用開發(fā)和營銷中心。公司已擁有13項專利,30多項軟件著作權,其中包括基于知識網絡的文本標引系統(tǒng)及其方法、知識網絡的半自動生成方法、基于視覺的Web頁面萃取方法等。
海量一直以來將技術創(chuàng)新作為公司發(fā)展的源動力,涉及人工智能、中文自然語言理解、機器學習等領域;曾承擔國家863計劃課題“智能信息內容分析方法研究”、國家重點攻關項目“中文智能搜索引擎系統(tǒng)的基礎”、國家科委科技型中小企業(yè)技術創(chuàng)新基金支持項目“基于Linux的超大規(guī)模句子級全文檢索”等十余項國家項目的研究工作。并擁有自己的智能計算研究中心,成員學歷全部為碩士以上畢業(yè)。先后研發(fā)出自主知識產權的中文分詞、命名實體識別、句法分析、中文檢索、判定圖、機器學習等相關核心技術和產品。
大數據時代來臨,憑借多年來在自然語言處理及智能計算技術領域的研究成果,海量公司2013年正式推出海量大數據情報服務平臺。平臺基于互聯(lián)網資訊、微博、微信、電商網站、社區(qū)、博客等公開信息進行采集、加工技術,面向各行業(yè)情報應用,按需提供經過深度標引的情報數據和分析圖表,為各行業(yè)最終用戶及獨立數據增值服務商即IDV(Independent Data Value-added Vendor)提供全面的數據加工和技術支撐服務,支持以可視化的方式配置情報任務需求,并以數據可視化、圖表及報告的形式展示情報數據,從而為最終用戶及IDV提供準確、全面、及時、深度的情報服務。
2016年海量已與天津中新生態(tài)城合作,在中新生態(tài)城建設“海量大數據重度孵化產業(yè)基地”“海量大數據分析學院”,由中新生態(tài)城免費提供辦公、教學及住宿條件,以海量大數據分析學院培育高端人才為抓手,同時配套大數據重度孵化器與孵化示范園,以適宜創(chuàng)業(yè)的產業(yè)環(huán)境與政策吸引人才、以適宜的居住環(huán)境留住人才,打造以“海量大數據產業(yè)園區(qū)”為核心的中國大數據應用產業(yè)集聚中心,形成涵蓋大數據平臺、專業(yè)應用、創(chuàng)業(yè)孵化、人才培養(yǎng)為一體的大數據生態(tài)體系。