Back to Question Center
0

Chrome Web Scrapbook Tutorial ຈາກ Semalt Expert

1 answers:

ຖ້າທ່ານກໍາລັງໃຊ້ Google Chrome, ເຊິ່ງສາມາດຊ່ວຍໃຫ້ຂີ້ຝຸ່ນຫນ້າເວັບຕ່າງໆ. ມັນຖືກເອີ້ນວ່າ 'Scrapper' ແລະມັນສາມາດໃຊ້ໄດ້ໂດຍບໍ່ມີບັນຫາ. Scrapper ຈະຊ່ວຍໃນການຂູດເນື້ອຫາເວັບໄຊທ໌ແລະອັບໂຫຼດຜົນໄດ້ຮັບໃນເອກະສານ Google.

ວິທີການຕັດເວັບໄຊທ໌ໂດຍໃຊ້ Scraper extension?

1. ເລືອກ Chrome Web Store ໃນ Google Chrome;

2. ໃນຂະຫຍາຍ, ດໍາເນີນການຄົ້ນຫາສໍາລັບ 'Scrapper' ';

3. ຜົນໄດ້ຮັບຄົ້ນຫາຄັ້ງທໍາອິດແມ່ນການຂະຫຍາຍທີ່ເອີ້ນວ່າ 'Scrapper';

4. ກົດປຸ່ມຕໍ່ໄປນີ້

4. ເລືອກປຸ່ມທີ່ລະບຸໄວ້ໃນ "Add to Chrome"

8. ຄລິກຂວາເພື່ອເລືອກ "Scrape

7.

9. ຄອນໂຊນສໍາລັບ scrapper ຈະປາກົດຢູ່ໃນປ່ອງອື່ນ

10. ເບິ່ງເນື້ອໃນຂີ້ເຫຍື້ອໃນ scraper

11. ເພື່ອຮັບປະກັນວ່າເນື້ອຫາຈະຖືກບັນທຶກໄວ້ເປັນ Google Spreadsheet, ເລືອກ "Save to Google Docs ... "

Scraping Extended

ກ່ອນທີ່ຈະຕິດກັບສູດນີ້ , ມັນເປັນປະໂຫຍດທີ່ຈະເຂົ້າໃຈພື້ນຖານຂອງ HTML ຕົວຢ່າງເຊັ່ນທ່ານສາມາດອ່ານຂໍ້ແນະນໍາສັ້ນໆກ່ຽວກັບ HTML ໂດຍຜ່ານການເຊື່ອມຕໍ່ນີ້

ຈົ່ງ imagine ພວກເຮົາສົນໃຈໃນຮູບເງົາທັງຫມົດທີ່ starred Asia Argento, ນັກສະແດງລະຄອນຜູ້ຍິງທີ່ມີຊື່ສຽງໃນອິຕາລີ

1 ມີເອກະສານທີ່ມີລາຍະລະອຽດກ່ຽວກັບຜູ້ກ່ຽວຂ້ອງໃນ IMDB. ເວັບໄຊຕ໌ Asia Argento ແມ່ນ: https://www.imdb.com/name/nm0000782/

2 ໃນທີ່ນີ້, ທ່ານສາມາດເບິ່ງພາລະບົດບາດທັງຫມົດທີ່ສະແດງໂດຍນັກສະແດງ..ໃຫ້ເລີ່ມຕົ້ນຂູດເອົາຂໍ້ມູນທີ່ພວກເຮົາສົນໃຈ;

3. ພະຍາຍາມຂັດມັນຕາມວິທີທີ່ໄດ້ອະທິບາຍຂ້າງເທິງນີ້;

4. ທ່ານຈະເຫັນວ່າບັນຊີລາຍຊື່ຖືກບິດເບືອນ. ນີ້ແມ່ນເນື່ອງມາຈາກຄວາມຈິງທີ່ວ່າບັນຊີລາຍຊື່ຢູ່ທີ່ນີ້ສາມາດຖືກສ້າງຂຶ້ນໂດຍແຕກຕ່າງກັນ;

5. ໄປຫາເຄື່ອງຄອມພິວເຕີ scraper. ດ້ານເທິງສຸດ, ທ່ານຈະເຫັນກ່ອງຂະຫນາດນ້ອຍທີ່ກ່າວວ່າ XPath;

6. Xpath ແມ່ນພາສາແບບສອບຖາມທີ່ເຮັດວຽກສໍາລັບ XML ແລະ HTML;

7. XPath ສາມາດຊ່ວຍຊອກຫາສະຖານທີ່ຂອງຫນ້າທີ່ທ່ານສົນໃຈ. ສິ່ງຕໍ່ໄປແມ່ນຊອກຫາອົງປະກອບທີ່ເຫມາະສົມແລະຂຽນ XPath ສໍາລັບມັນ;

8. ຕອນນີ້ໃຫ້ຈັດຕາຕະລາງຂອງພວກເຮົາ;

9. ທ່ານຈະເຫັນວ່າ XPath ຂອງພວກເຮົາທີ່ມີຂໍ້ມູນທີ່ຈໍາເປັນທັງຫມົດແມ່ນ "// div [3] / div [3] / div [2] / div";

10. XPath ແຈ້ງລະບົບເພື່ອເບິ່ງເອກະສານ HTML ແລະເລືອກອົງປະກອບທີສາມ, ຫຼັງຈາກນັ້ນອົງປະກອບທີສອງແລະຫຼັງຈາກນັ້ນທັງຫມົດຂອງມັນ;

11. ແຕ່ວ່າ, ພວກເຮົາຢາກໃຫ້ຂໍ້ມູນຂອງພວກເຮົາແບ່ງອອກ;

12. ນໍາໃຊ້ສ່ວນຄໍລໍາໃນ console ສໍາລັບ scrapper ເພື່ອໃຫ້ໄດ້ເຮັດແບບນີ້;

13. ກ່ອນທີ່ຈະຊອກຫາຫົວຂໍ້ຂອງພວກເຮົາ, ໃຫ້ນໍາໃຊ້ການກວດກາອົງປະກອບເພື່ອເບິ່ງຫົວຂໍ້;

14. ກວດເບິ່ງຫົວຂໍ້ພາຍໃນໂຄດຄໍາສັ່ງ. ເພີ່ມແທໍກໃນ XPath

15. ການສະແດງອອກຈະເຮັດວຽກຢ່າງເຫມາະສົມ, ເຮັດໃຫ້ມັນເປັນຄໍລໍາທໍາອິດຂອງພວກເຮົາ;

16. ໃນສ່ວນ "ຄໍລໍາ", ປ່ຽນຊື່ຂອງຄໍລໍາທໍາອິດເປັນ "ຫົວຂໍ້";

17. ຕື່ມ XPath ກັບມັນ;

18. ໃນສ່ວນຄໍລໍາ, XPaths ແມ່ນກ່ຽວຂ້ອງແລະມັນຫມາຍຄວາມວ່າ "./b" ຈະເລືອກເອົາອົງປະກອບ

19. ໃນ XPath ສໍາລັບຄໍລໍາຫົວຂໍ້, ເພີ່ມ "./b" ແລະເລືອກເອົາ "scrape";

20. ຕອນນີ້ຈະສືບຕໍ່ໄປເປັນປີ. ປີສາມາດພົບໄດ້ພາຍໃນໄລຍະຫນຶ່ງ;

21. ສ້າງຄໍລໍາໃຫມ່ໂດຍເລືອກເອົາຂະຫນາດນ້ອຍທີ່ຢູ່ໃກ້ກັບຄໍລໍາສໍາລັບຊື່ຂອງທ່ານ;

22. ໃຊ້ XPath "./span" ສ້າງຄໍລໍາສໍາລັບ "ປີ";

23. ກົດຂີ້ຝຸ່ນແລະເບິ່ງວິທີການເພີ່ມປີ;

24 ເຮັດແລ້ວ!

December 6, 2017
Chrome Web Scrapbook Tutorial ຈາກ Semalt Expert
Reply