1.解析PDF,Word,PPT等各類文件格式,?根據(jù)需求提取文字、表格、公式、圖像等結(jié)構(gòu)化信息;2.根據(jù)需求將文字,圖像,表格,公式等信息組織成文檔;3.編碼并實現(xiàn)信息提取的標準庫,服務(wù)公司各個產(chǎn)品;4.進行相關(guān)領(lǐng)域的算法研究,跟進前沿技術(shù),服務(wù)各類項目的需求。?職位要求:1.計算機相關(guān)專業(yè)本科及以上學(xué)歷;2.熟悉pdf文件格式,有過pdf文件信息提取的相關(guān)經(jīng)驗,熟悉pdf標準者優(yōu)先;3.至少精通下列語言之一:python,java,C++;4.熟悉docx,pptx,xlsx標準者優(yōu)先;5.有深度學(xué)習(xí)和機器學(xué)習(xí)經(jīng)驗者優(yōu)先;6.有計算機視覺和計算機圖形學(xué)經(jīng)驗者優(yōu)先;7.思路清晰,主動性強,有很強的自我驅(qū)動力;8.優(yōu)秀的分析和解決問題的能力,和快速學(xué)習(xí)的能力。