ฟีเจอร์ ‘Shazam for Birds’ ใหม่ของแอปนี้เกิดขึ้นได้ผ่านวิทยาศาสตร์พลเมือง สล็อตเว็บตรง แตกง่าย นี่คือวิธีการทำงาน และเหตุผลที่คุณควรดาวน์โหลด
โดย CHARLOTTE HU | อัปเดต 28 ก.ค. 2564 08:20 น.
เทคโนโลยี
สิ่งแวดล้อม
นกแบล็กเบิร์ดปีกแดงร้องเพลง
นี่ใครร้อง แอป Merlin ที่อัปเดตของ Cornell สามารถฟังและค้นหาข้อมูลให้คุณได้ Drew Weber / Cornell Lab of Ornithology Macaulay Library
แบ่งปัน
เมื่อปีที่แล้ว เมื่อมีการจำกัดการแพร่ระบาดในสหรัฐฯ ผู้ชื่นชอบนกรายใหม่ต่างแห่กันไปที่แอป Merlin Bird ID ฟรี แอพที่มาจาก Cornell Lab of Ornithology ก่อนหน้านี้ได้เสนอวิธีที่ผู้ใช้สามารถระบุนกลึกลับที่อยู่ใกล้พวกเขาผ่านคำอธิบายหรือภาพถ่าย ช่วงต้นฤดูร้อนนี้ ได้รับคุณลักษณะที่เจ๋งกว่าเดิม: ความสามารถในการจดจำนกโดยอาศัยคลิปเสียงสั้น ๆ ของเพลง เจี๊ยบ หรือการโทร
ของ Merlin เห็นจำนวนการดาวน์โหลดแอปที่เพิ่มขึ้น
ซึ่งเป็นเทรนด์ที่ยังคงมีอยู่ Drew Weber ผู้ประสานงานโครงการของ Merlin กล่าวว่า “ไม่เพียงแต่เราได้รับการดาวน์โหลดมากขึ้นเท่านั้น แต่จำนวนผู้ใช้ที่ใช้งานอยู่ยังคงเพิ่มขึ้นอย่างต่อเนื่อง” Drew Weber ผู้ประสานงานโครงการของ Merlin กล่าว ฤดูใบไม้ผลินี้ ผู้คน 1.2 ล้านคน (และเพิ่มขึ้นเรื่อยๆ) อยู่ที่ Merlin “ผู้คนดาวน์โหลดมัน เข้าไปในนก และพวกมันก็ยังเป็นนกในปีนี้ แม้ว่าความเป็นจริงของการล็อคดาวน์และสิ่งดังกล่าวจะเปลี่ยนไป” เขากล่าว “ดูเหมือนว่าพวกเขาจะกระตุ้นความสนใจของพวกเขา และรักษาความสนใจของพวกเขาไว้”
สิ่งนี้เกิดขึ้นในช่วงเวลาที่ข่าวนกบินตาม โดยเฉพาะอย่างยิ่งในนิวยอร์กซิตี้ ที่ซึ่งนกหายากบางชนิดได้เพิ่มขึ้นเพื่อสถานะผู้มีชื่อเสียง นกเค้าแมวหิมะตกประดับหน้าหนังสือพิมพ์ The New York Timesและเป็ดแมนดารินถูกเขียนขึ้นในนิตยสาร New Yorkในปี 2018 ราวกับเป็นผู้มีอิทธิพลคนต่อไปที่ควรรู้
Sound ID ซึ่งเปิดตัวใน Merlin ในเดือนมิถุนายน ได้รับการตอบรับเป็นอย่างดีจากชุมชนการดูนก คุณลักษณะการระบุเสียงแบบใหม่นี้มาพร้อมกับเครื่องมือ ID ภาพถ่ายที่ใช้การเรียนรู้ด้วยเครื่อง ซึ่งเปิดให้ผู้ใช้ใช้งานได้ประมาณปี 2015
“ก่อนที่จะมีการเปิดตัว ID เสียง ฉันคิดว่าข้อเสนอแนะที่ใหญ่ที่สุดของเราคือ ‘ฉันคิดว่าคุณสามารถระบุนกด้วยเสียงด้วยแอพนี้!’ หรือ ‘Shazam สำหรับนกอยู่ที่ไหน’ ดังนั้นมันเจ๋งจริงๆ ที่ได้ส่งสิ่งนั้นให้กับผู้คน” เวเบอร์กล่าว
เราตั้งชื่อแอปนี้ว่า “Merlin” เพราะมันเป็นวิธีที่แปลกประหลาดและเกือบจะมหัศจรรย์ในการเดาว่าคุณเห็นนกตัวไหน (หรืออย่างน้อยนั่นคือเป้าหมายที่เรากำลังดำเนินการอยู่) pic.twitter.com/xh4eV01MQT
— Merlin Bird ID (@MerlinBirdID) 7 กรกฎาคม 2564
มีตัวเลือกอื่นๆ สองสามตัวในการระบุนกด้วยเสียง รวมถึง Bird Genie, Song Sleuth และ Smart Bird ID หลายคนใช้อัลกอริธึมที่ใช้การเรียนรู้ของเครื่อง แต่ความแม่นยำของผลลัพธ์อาจแตกต่างกันไปตามเสียงพื้นหลังและความแตกต่างของเสียงนกร้อง
Merlin เป็นแอพแนะนำนกที่เป็นที่ยอมรับอยู่แล้ว มีขั้นตอนการแนะนำสำหรับการระบุโดยปกติที่เป็นประโยชน์สำหรับมือใหม่ birders นอกเหนือจากเครื่องมือขั้นสูง
นี่คือวิธีการทำงานของรหัสเสียงของ Merlin
นักดูนกสามารถเปิดไมโครโฟนของโทรศัพท์ผ่าน Merlin และให้โทรศัพท์ฟังสิ่งที่อยู่รอบตัวพวกเขาได้ จากนั้นแอปจะแสดงคำแนะนำว่านกกำลังร้องเพลงหรือโทรหาอะไร เสียงที่แอปหยิบขึ้นมานั้นจะเปลี่ยนเป็นรูปแบบการแสดงภาพที่เรียกว่าสเปกโตรแกรมซึ่งจับแอมพลิจูด ความถี่ และระยะเวลาของเสียง
“ทันทีที่คุณมีภาพนกจริงบนต้นไม้หรือลายเซ็นเสียงในรูปแบบของสเปกโตรแกรม คุณสามารถใช้เครื่องมือคอมพิวเตอร์วิทัศน์ที่มีประสิทธิภาพเพื่อเริ่มสร้างแบบจำลองเพื่อจดจำรูปแบบเหล่านั้นได้” Grant Van Horn กล่าว หัวหน้านักวิจัยในโครงการเมอร์ลิน
นอกจากรหัสเสียงแล้ว วิธีอื่นๆ ในการใช้แอปเพื่อระบุนก
ก็คือการป้อนลักษณะทางกายภาพของนกด้วยตนเองและอัปโหลดภาพถ่าย
ความสำเร็จที่ยิ่งใหญ่ของวิทยาศาสตร์พลเมือง
ระบบปัญญาประดิษฐ์ต้องการข้อมูล และแน่นอนว่าข้อมูลนั้นจำเป็นต้องมีอยู่ตั้งแต่แรก
ในกรณีนี้ โครงการต้องใช้วิทยาศาสตร์พลเมืองอย่างจริงจัง คุณลักษณะ photo ID และตัวเลือก ID เสียงที่ใหม่กว่า จะไม่สามารถสร้างขึ้นได้หากไม่มีฐานข้อมูล Macaulay Library ของ Lab of Ornithology ซึ่งประกอบด้วยภาพถ่ายนกที่เก็บถาวรและใส่คำอธิบายประกอบเกือบ 30 ล้านภาพและเสียงกัดกว่า 1.1 ล้านครั้งที่อัปโหลดโดยชุมชนนก .
จากนั้นทีมงานก็เริ่มทำงานเพื่อแปลงสื่อเป็นเครื่องมือที่มีประโยชน์ พวกเขาเริ่มสร้างส่วนประกอบ ID ภาพถ่ายของ Merlin ในปี 2555 ในเวลาเดียวกันกับที่มีความก้าวหน้าในการมองเห็นด้วยคอมพิวเตอร์ Van Horn กล่าวว่า “เรารู้ว่าถ้าเราสามารถรวบรวมข้อมูลร่วมกันได้ เราสามารถใช้เครื่องมือเหล่านี้เพื่อสร้างคุณลักษณะที่มีประโยชน์อย่างมาก ซึ่งจะทำให้ใครบางคนถ่ายรูปและให้คอมพิวเตอร์บอกพวกเขาว่ามีอะไรอยู่ในภาพนั้น” Van Horn กล่าว ภายในปี 2015 ห้องปฏิบัติการสามารถให้นักวิทยาศาสตร์พลเมืองอัปโหลดรูปภาพและเสียงไปยังคอลเล็กชันที่กำลังเติบโตได้ นับตั้งแต่เปิดตัวองค์ประกอบ photo ID ในแอป ได้มีการปรับปรุงอย่างต่อเนื่องด้วยการเพิ่มตัวอย่างภาพถ่ายและการขยายความครอบคลุมของสายพันธุ์ในภูมิภาคใหม่ๆ ในอเมริกาใต้ แอฟริกา เอเชีย และยุโรป “แมชชีนเลิร์นนิงจะทำงานได้ดีก็ต่อเมื่อคุณมีข้อมูลพื้นฐานที่ดี ซึ่งคุณสามารถสร้างได้
แหล่งที่มาของคลิปเสียงและภาพถ่ายที่เข้าสู่ Macaulay Library มาจากโปรแกรมอื่นที่ห้องปฏิบัติการเรียกว่าeBirdซึ่งเปิดตัวในปี 2545 แอป eBirdช่วยให้นักวิทยาศาสตร์พลเมืองและองค์กรท้องถิ่นทั่วโลกสามารถบันทึกและแบ่งปันนกได้ การพบเห็น รวมทั้งนักวิทยาศาสตร์ที่ศึกษาและวางแผนประชากรนก
“เนื่องจากเราได้รวบรวมข้อมูลนี้มาเป็นเวลานาน เราจึงมีความรู้สึกที่ดีว่า ถ้าคุณอยู่ในนิวยอร์กซิตี้ในวันที่ 19 กรกฎาคม คุณจะพบสายพันธุ์ใด” Van Horn กล่าว “ข้อมูลประเภทนั้นช่วยเราในเรื่อง Sound ID และ photo ID ได้จริง ๆ เพราะมันทำให้เราเอาปัญหา 450 สปีชีส์สำหรับ sound ID, 8,000 สปีชีส์สำหรับ photo ID และมันช่วยให้เราจำกัดให้เหลือ 40 สปีชีส์ที่อยู่ภายใต้ พิจารณาที่นี่”
ความคืบหน้าขององค์ประกอบรหัสเสียงนั้นช้ากว่ารหัสภาพ “เพียงเพราะกิจวัตรในการออกไปข้างนอกและบันทึกการโทรของนกนั้นไม่ค่อยเป็นที่นิยมเท่าการไปและถ่ายรูปพวกมัน” Van Horn กล่าว “แต่แน่นอนว่าในช่วงสามปีที่ผ่านมา อเมริกาเหนือเต็มไปด้วยการบันทึกเสียง”
ประมาณช่วงเวลานี้ของปีที่แล้ว ทีมงานตัดสินใจว่ามีข้อมูลเสียงเพียงพอที่จะสร้างและเปิดใช้คุณลักษณะการระบุเสียงสำหรับสายพันธุ์ที่ได้รับความนิยมในสหรัฐอเมริกาและแคนาดา พวกเขาเริ่มรวบรวมข้อมูลทั้งหมดและเลือกสายพันธุ์
อย่างไรก็ตาม ปัญหาเสียงพื้นหลังยังคงเป็นความ
ท้าทายสำหรับทีมวิศวกร เพื่อแก้ปัญหานั้น พวกเขาหันไปใช้ข้อมูลเสียงที่มีอยู่ ชุดข้อมูลเสียงเหล่านี้อาจเป็นของฉากการจราจร สภาพแวดล้อมในเมือง และเสียงเครื่องจักร ซึ่งเป็นเสียงปกติที่ไม่ได้มาจากนก “เราจะแปลงเสียงเหล่านั้นเป็นสเปกตรัมและใช้สิ่งเหล่านี้เป็นตัวอย่างเชิงลบของ ‘นี่ไม่ใช่นก; เมื่อใดก็ตามที่คุณเห็นสิ่งนี้ คุณไม่ควรรายงานสายพันธุ์นก” Van Horn กล่าวเสริม “มันเป็นความสมดุลระหว่างการสร้างชุดข้อมูลนกคุณภาพสูงและการเสริมชุดข้อมูลที่ดีของเสียงที่ไม่ใช่เสียงนก ซึ่งเราสามารถแสดงเครื่องจักรและสอนสิ่งที่นกไม่ชอบได้”
[ที่เกี่ยวข้อง: วิธีเริ่มดูนกในเมืองต่างๆ ในสหรัฐอเมริกา ]
แล้วก็มีงานเข้ามาอีก เนื่องจากความสำเร็จของโครงการขึ้นอยู่กับชุดข้อมูลที่มีคุณภาพสูง นั่นหมายความว่า Weber และ Van Horn ต้องจัดระเบียบและคัดเลือกสมาชิกที่มีความเชี่ยวชาญสูงจากชุมชนการดูนกเพื่อช่วยพวกเขาผ่านไฟล์เสียงดิบในฐานข้อมูลและติดป้ายกำกับสายพันธุ์ ที่อยู่ในบันทึก
“ในการสร้างชุดข้อมูลของเราสำหรับการเปิดตัวครั้งแรก ฉันคิดว่าเราใส่คำอธิบายประกอบประมาณ 2,000 ชั่วโมง โดยวาดที่ที่นกกำลังร้องเพลง ที่ซึ่งนกต่างๆ กำลังร้องเพลง” เวเบอร์กล่าว “ส่วนใหญ่เป็นความพยายามของอาสาสมัครจากคนกลุ่มเดียวกันจำนวนมากที่กำลังป้อนข้อมูลและการสังเกตการณ์ eBird เหล่านี้” สล็อตเว็บตรง แตกง่าย