Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Ang tahas sa pagbalhin sa datos gikan sa usa ka spreadsheet sa usa ka PDF file ngadto sa usa ka sheet sa Microsoft Excel kanunay nga "makalingaw". Ilabi na kung wala ka mahal nga software sa pag-ila sama sa FineReader o ingon niana. Ang direktang pagkopya kasagaran dili mosangpot sa bisan unsa nga maayo, tungod kay. human sa pag-paste sa gikopya nga datos ngadto sa panid, sila lagmit “mag-uban” sa usa ka kolum. Mao nga sila kinahanglan nga malisud nga ibulag gamit ang usa ka himan Teksto pinaagi sa mga kolum gikan sa tab Data (Data — Teksto sa mga Kolum).

Ug siyempre, ang pagkopya posible lamang alang sa mga PDF file diin adunay usa ka layer sa teksto, ie sa usa ka dokumento nga bag-o lang gi-scan gikan sa papel ngadto sa PDF, kini dili molihok sa prinsipyo.

Pero dili sad kaayo 🙂

Kung ikaw adunay Office 2013 o 2016, unya sa pipila ka minuto, nga wala’y dugang nga mga programa, posible nga ibalhin ang data gikan sa PDF sa Microsoft Excel. Ug ang Pulong ug Gahum nga Pangutana makatabang kanato niini.

Pananglitan, atong kuhaon kini nga PDF nga taho nga adunay daghang teksto, mga pormula ug mga lamesa gikan sa website sa Economic Commission for Europe:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

... ug sulayi nga makuha gikan niini sa Excel, isulti ang una nga lamesa:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Tana!

Lakang 1. Ablihi ang PDF sa Pulong

Sa pipila ka rason, pipila ka mga tawo ang nahibal-an, apan sukad sa 2013 Microsoft Word nakakat-on sa pag-abli ug pag-ila sa mga PDF file (bisan ang mga na-scan, nga mao, walay text layer!). Gihimo kini sa hingpit nga sumbanan nga paagi: ablihi ang Pulong, i-klik File - Bukas (File — Bukas) ug ipiho ang PDF format sa drop-down list sa ubos nga tuo nga suok sa bintana.

Dayon pilia ang PDF file nga atong gikinahanglan ug i-klik Open (Bukas). Ang Pulong nagsulti kanato nga kini modagan sa OCR niini nga dokumento ngadto sa teksto:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Miuyon kami ug sa pipila ka mga segundo makita namon ang among PDF nga bukas para sa pag-edit na sa Pulong:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Siyempre, ang disenyo, mga estilo, mga font, mga ulohan ug mga footer, ug uban pa, partially fly off sa dokumento, apan kini dili importante alang kanamo - nagkinahanglan lamang kami og data gikan sa mga lamesa. Sa prinsipyo, niining yugtoa, makatintal na nga kopyahon lang ang lamesa gikan sa giila nga dokumento ngadto sa Pulong ug i-paste lang kini sa Excel. Usahay kini molihok, apan mas kanunay kini modala ngadto sa tanan nga mga matang sa mga pagtuis sa datos - pananglitan, ang mga numero mahimong mga petsa o magpabilin nga teksto, sama sa atong kaso, tungod kay. Ang PDF naggamit sa dili mga separator:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Busa dili kita magputol sa mga kanto, apan himoon ang tanan nga mas komplikado, apan husto.

Lakang 2: I-save ang Dokumento isip Web Page

Aron dayon ma-load ang nadawat nga datos sa Excel (pinaagi sa Power Query), ang among dokumento sa Word kinahanglan nga i-save sa format sa web page - kini nga format, sa kini nga kaso, usa ka klase nga sagad nga denominator tali sa Word ug Excel.

Aron mahimo kini, adto sa menu File - I-save Ingon (File — Save As) o pindota ang yawe F12 sa keyboard ug sa bintana nga nagbukas, pilia ang tipo sa file Web page sa usa ka file (Webpage — Usa ka file):

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Pagkahuman sa pagtipig, kinahanglan ka makakuha usa ka file nga adunay extension nga mhtml (kung makita nimo ang mga extension sa file sa Explorer).

Stage 3. Pag-upload sa file ngadto sa Excel pinaagi sa Power Query

Mahimo nimong ablihan ang gibuhat nga MHTML file sa Excel direkta, apan dayon makuha namon, una, ang tanan nga sulud sa PDF sa usa ka higayon, kauban ang teksto ug usa ka hugpong sa wala kinahanglana nga mga lamesa, ug, ikaduha, mawad-an na usab kami mga datos tungod sa sayup. mga separator. Busa, atong buhaton ang import ngadto sa Excel pinaagi sa Power Query add-in. Kini usa ka bug-os nga libre nga add-on diin mahimo nimong i-upload ang data sa Excel gikan sa halos bisan unsang gigikanan (mga file, folder, database, mga sistema sa ERP) ug dayon pagbag-o ang nadawat nga datos sa tanan nga posible nga paagi, gihatagan kini nga gusto nga porma.

Kung ikaw adunay Excel 2010-2013, mahimo nimong i-download ang Power Query gikan sa opisyal nga website sa Microsoft - pagkahuman sa pag-install makakita ka usa ka tab. Kusog nga Pagpangutana. Kung ikaw adunay Excel 2016 o mas bag-o, nan dili nimo kinahanglan nga i-download ang bisan unsang butang - ang tanan nga gamit natukod na sa Excel nga default ug nahimutang sa tab. Data (Petsa) sa grupo Pag-download ug Pag-convert (Pagkuha ug Pagbag-o).

Mao nga moadto kami sa tab Data, o sa tab Kusog nga Pagpangutana ug pagpili og team Para makakuha ug data or Paghimo Pangutana - Gikan sa File - Gikan sa XML. Aron makita dili lang ang mga XML file, usba ang mga filter sa drop-down list sa ubos nga tuo nga suok sa bintana aron Tanan nga mga file (Tanan nga mga file) ug ipiho ang among MHTML file:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Palihug timan-i nga ang import dili makompleto nga malampuson, tungod kay. Gipaabot sa Power Query ang XML gikan kanamo, apan aduna gyud kami format nga HTML. Busa, sa sunod nga bintana nga makita, kinahanglan nimo nga i-right-click ang file nga dili masabtan sa Power Query ug ipiho ang format niini:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Pagkahuman niana, ang file mailhan sa husto ug makita namon ang usa ka lista sa tanan nga mga lamesa nga naa niini:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Mahimo nimong tan-awon ang mga sulud sa mga lamesa pinaagi sa pag-klik sa wala nga buton sa mouse sa puti nga background (dili sa pulong nga Table!) sa mga cell sa kolum sa Data.

Kung ang gusto nga lamesa gihubit, i-klik ang berde nga pulong Table - ug ikaw "nahulog" sa sulod niini:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

Nagpabilin nga buhaton ang pipila ka yano nga mga lakang aron "pagsuklay" ang mga sulud niini, nga mao:

  1. kuhaa ang wala kinahanglana nga mga kolum (pag-klik sa tuo sa ulohan sa kolum - Kuhaa)
  2. pulihan ang mga tuldok og mga koma (pilia ang mga kolum, pag-right-click - Pag-ilis sa mga mithi)
  3. kuhaa ang parehas nga mga timaan sa ulohan (pilia ang mga kolum, pag-right-click - Pag-ilis sa mga mithi)
  4. kuhaa ang taas nga linya (Home - Pagtangtang sa mga linya - Pagtangtang sa mga taas nga linya)
  5. kuhaa ang mga blangko nga linya (Balay - Pagtangtang sa mga linya - Pagtangtang sa mga walay sulod nga linya)
  6. ipataas ang unang laray ngadto sa ulohan sa lamesa (Panimalay – Gamita ang unang linya isip mga ulohan)
  7. pagsala sa wala kinahanglana nga datos gamit ang usa ka filter

Kung ang lamesa dad-on sa normal nga porma, mahimo kini idiskarga sa sheet gamit ang mando pagsira ug pag-download (Close & Load) on ang nag-unang tab. Ug makakuha kami sa ingon nga katahum diin mahimo na namon nga magtrabaho:

Import data gikan sa PDF ngadto sa Excel pinaagi sa Power Query

  • Pag-usab sa usa ka Kolum ngadto sa usa ka Talaan nga adunay Power Query
  • Pagbahin sa sticky text ngadto sa mga column

Leave sa usa ka Reply