วิธีการรวบรวมข้อมูลไซต์ขนาดใหญ่และดึงข้อมูลโดยใช้ SEO Spider ของ Screaming Frog

กบ SEO Screaming แมงมุม

เรากำลังให้ความช่วยเหลือลูกค้าหลายรายด้วย การโยกย้าย Marketo. ในขณะที่ บริษัท ขนาดใหญ่ใช้โซลูชันระดับองค์กรเช่นนี้ก็เหมือนกับใยแมงมุมที่ถักทอเป็นกระบวนการและแพลตฟอร์มในช่วงหลายปีที่ผ่านมา…จนถึงจุดที่ บริษัท ต่างๆไม่ได้ตระหนักถึงทุกช่องทางติดต่อ

ด้วยแพลตฟอร์มการตลาดอัตโนมัติขององค์กรเช่น Marketo แบบฟอร์มเป็นจุดเริ่มต้นของข้อมูลทั่วทั้งไซต์และหน้า Landing Page บริษัท ต่างๆมักจะมีหลายพันหน้าและหลายร้อยแบบทั่วทั้งไซต์ของตนซึ่งจำเป็นต้องระบุเพื่อทำการอัปเดต

เครื่องมือที่ยอดเยี่ยมสำหรับสิ่งนี้คือ กรี๊ดสไปเดอร์ SEO ของ Frog…อาจเป็นแพลตฟอร์มที่ได้รับความนิยมมากที่สุดในตลาดสำหรับการรวบรวมข้อมูลตรวจสอบและดึงข้อมูลจากไซต์ แพลตฟอร์มนี้มีฟีเจอร์มากมายและมีตัวเลือกหลายร้อยตัวสำหรับแทบทุกงานที่คุณต้องการ

Screaming Frog SEO Spider: รวบรวมข้อมูลและสารสกัด

คุณสมบัติที่สำคัญของ Screaming Frog SEO Spider คือคุณสามารถทำการแยกแบบกำหนดเองตามไฟล์ regex, XPath,หรือ CSSPath เฉพาะ สิ่งนี้มีประโยชน์อย่างยิ่งเนื่องจากเราต้องการรวบรวมข้อมูลไซต์ของลูกค้าและตรวจสอบและจับค่า MunchkinID และ FormId จากหน้าต่างๆ

ด้วยเครื่องมือเปิด การกำหนดค่า> กำหนดเอง> การแยก เพื่อระบุองค์ประกอบที่คุณต้องการแยก

กรีดร้องที่กำหนดเองสกัด

หน้าจอการแยกช่วยให้สามารถรวบรวมข้อมูลได้ไม่ จำกัด :

กฎการสกัดแมงมุม Screaming Frog SEO

Regex, XPath และ CSSPath Extraction

สำหรับ MunchkinID ตัวระบุจะอยู่ภายในสคริปต์ฟอร์มที่อยู่ในเพจ:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

จากนั้นเราใช้ a กฎ Regex ในการจับ id จากภายในแท็กสคริปต์ที่แทรกในหน้า:

Regex: ["']id["']: *["'](.*?)["']

สำหรับ Form ID ข้อมูลจะอยู่ในแท็กอินพุตภายในแบบฟอร์ม Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

เราใช้ กฎ XPath เพื่อบันทึกรหัสจากภายในแบบฟอร์มที่แทรกในหน้า แบบสอบถาม XPath ค้นหาแบบฟอร์มที่มีอินพุตที่มีชื่อเป็น น่าเกรงขามจากนั้นการแยกจะบันทึกไฟล์ ความคุ้มค่า:

XPath: //form/input[@name="formid"]/@value

กรีดร้อง Frog SEO Spider Javascript Rendering

อีกหนึ่งตัวเลือกที่ยอดเยี่ยมของ Screaming Frog คือคุณไม่ จำกัด เฉพาะ HTML ในหน้านี้คุณสามารถแสดง JavaScript ที่จะแทรกแบบฟอร์มภายในไซต์ของคุณได้ ภายใน การกำหนดค่า> แมงมุมคุณสามารถไปที่แท็บการแสดงผลและเปิดใช้งาน

กรีดร้อง Frog SEO Spider Javascript Rendering

แน่นอนว่าจะใช้เวลาในการรวบรวมข้อมูลไซต์นานกว่าเล็กน้อย แต่คุณจะได้รับแบบฟอร์มที่แสดงผลจากฝั่งไคลเอ็นต์โดย JavaScript รวมถึงแบบฟอร์มที่แทรกฝั่งเซิร์ฟเวอร์

แม้ว่านี่จะเป็นแอปพลิเคชันที่เฉพาะเจาะจงมาก แต่ก็มีประโยชน์อย่างเหลือเชื่อเมื่อคุณทำงานกับไซต์ขนาดใหญ่ คุณจะต้องตรวจสอบว่าแบบฟอร์มของคุณถูกฝังไว้ที่ใดในไซต์

ดาวน์โหลด Screaming Frog SEO Spider

คุณคิดอย่างไร?

ไซต์นี้ใช้ Akismet เพื่อลดสแปม เรียนรู้วิธีการประมวลผลข้อมูลความคิดเห็นของคุณ.