- การประมวลผลบนคลาวด์คืออะไร›
- ฮับแนวคิดการประมวลผลบนคลาวด์›
- ปัญญาประดิษฐ์
คอมพิวเตอร์วิทัศน์คืออะไร
คอมพิวเตอร์วิทัศน์คืออะไร
คอมพิวเตอร์วิชันเป็นเทคโนโลยีที่เครื่องใช้ในการรับรู้ภาพโดยอัตโนมัติและอธิบายภาพเหล่านั้นได้อย่างถูกต้องและมีประสิทธิภาพ ปัจจุบัน ระบบคอมพิวเตอร์สามารถเข้าถึงแหล่งที่มาของข้อมูลรูปภาพและวิดีโอที่มาจากหรือสร้างโดยสมาร์ทโฟน กล้องจราจร ระบบรักษาความปลอดภัย และอุปกรณ์อื่นๆ แอปพลิเคชันการมองเห็นคอมพิวเตอร์ใช้ปัญ ญาประดิ ษฐ์และการ เรียนรู้ของเครื่อง (AI/ML) เพื่อประมวลผลข้อมูลนี้อย่างแม่นยำสำหรับการระบุวัตถุและการจดจำใบหน้า รวมถึงการจำแนกประเภทคำแนะนำการตรวจสอบและการตรวจจับ
กรณีการใช้งาน
การรักษาความปลอดภัยและความปลอดภัย
รัฐบาลและองค์กรใช้วิสัยทัศน์คอมพิวเตอร์เพื่อปรับปรุงความปลอดภัยของทรัพย์สิน ไซต์ และสิ่งอำนวยความสะดวก ตัวอย่างเช่น กล้องและเซ็นเซอร์จะตรวจสอบพื้นที่สาธารณะ ไซต์อุตสาหกรรม และสภาพแวดล้อมที่ต้องการการรักษาความปลอดภัยสูง พวกเขาส่งการแจ้งเตือนอัตโนมัติหากมีบางสิ่งที่ไม่ธรรมดาเกิดขึ้น เช่น บุคคลที่ไม่ได้รับอนุญาตเข้าสู่พื้นที่จำกัด
ในทำนองเดียวกันการมองเห็นคอมพิวเตอร์สามารถปรับปรุงความปลอดภัยส่วนบุคคลที่บ้านและในที่ทำงาน ตัวอย่างเช่น เทคโนโลยีการรู้จำสามารถตรวจสอบปัญหาที่เกี่ยวข้องกับความปลอดภัยได้มากมาย ซึ่งรวมถึงการสตรีมบ้านแบบเรียลไทม์เมื่อตรวจจับสัตว์เลี้ยงได้ หรือการมีกล้องถ่ายสดทอดที่ประตูหน้าเมื่อตรวจจับได้ว่ามีแขกหรือมีคนมาส่งพัสดุ ในที่ทำงานการตรวจสอบดังกล่าวรวมถึงการสวมใส่ อุปกรณ์ป้องกันส่วนบุคคล ที่เหมาะ สม โดยคนงานแจ้งระบบเตือนหรือการสร้างรายงาน
ประสิทธิภาพด้านการปฏิบัติงาน
คอมพิวเตอร์วิสัยทัศน์สามารถวิเคราะห์ภาพและแยกข้อมูลเมตาสำหรับการข่าวกรองทางธุรกิจ สร้างโอกาสสร้างรายได้ใหม่และประสิทธิภาพในการดำเนินงาน ตัวอย่างเช่นมันสามารถ:
-
ระบุข้อบกพร่องด้านคุณภาพโดยอัตโนมัติก่อนที่ผลิตภัณฑ์จะออกจากโรงงาน
-
ตรวจจับปัญหาด้านการบำรุงรักษาเครื่องจักรและปัญหาด้านความปลอดภัย
-
วิเคราะห์ภาพโซเชียลมีเดียเพื่อค้นหาแนวโน้มและรูปแบบพฤติกรรมของลูกค้า
-
รับรองความถูกต้องของพนักงานด้วยการจดจำใบหน้าอัตโนมัติ
ยานยนต์อัตโนมัติ
เทคโนโลยียานพาหนะอัตโนมัติใช้วิสัยทัศน์คอมพิวเตอร์เพื่อจดจำภาพแบบเรียลไทม์และสร้างแผนที่ 3 มิติจากกล้องหลายตัวที่ติดตั้งสำหรับการขนส่งแบบอิสระ สามารถวิเคราะห์ภาพและระบุผู้ใช้ถนนป้ายถนนคนอื่น ๆ คนเดินเท้าหรืออุปสรรค
ในยานพาหนะกึ่งอิสระการมองเห็นด้วยคอมพิวเตอร์จะใช้แมชชีนเลิร์นนิ่ง (ML) เพื่อตรวจสอบพฤติกรรมของผู้ขับขี่ ตัวอย่างเช่น ระบบจะมองหาสัญญาณที่ชี้บ่งถึงความไขว้เขว เมื่อยล้า และง่วงนอนจากตำแหน่งศีรษะของคนขับ การติดตามสายตา และการเคลื่อนไหวร่างกายส่วนบน หากเทคโนโลยีรับสัญญาณเตือนบางอย่าง ระบบจะแจ้งเตือนผู้ขับขี่และลดโอกาสเกิดเหตุการณ์การขับขี่
การเกษตร
ตั้งแต่การเพิ่มผลผลิตไปจนถึงการลดต้นทุนด้วยระบบอัตโนมัติอัจฉริยะ แอปพลิเคชันวิสัยทัศน์คอมพิวเตอร์ช่วยเพิ่มการทำงานโดยรวมของภาคเกษตรกรรม การถ่ายภาพผ่านดาวเทียมและฟุตเทจของ UAV จะช่วยในการวิเคราะห์พื้นที่กว้างใหญ่ของที่ดินและปรับปรุงแนวปฏิบัติทางการเกษตร แอปพลิเคชันคอมพิวเตอร์วิชันจะทำงานโดยอัตโนมัติ เช่น การตรวจสอบสภาพพื้นที่ทางการเกษตร การระบุโรคพืช การตรวจสอบความชื้นในดิน รวมถึงการคาดการณ์สภาพอากาศและผลผลิตพืช การตรวจสอบสัตว์ด้วยวิสัยทัศน์คอมพิวเตอร์เป็นอีกกลยุทธ์สำคัญของการทำฟาร์มอัจฉริยะ
บริการด้านสาธารณสุข
การดูแลสุขภาพเป็นหนึ่งในอุตสาหกรรมชั้นนำที่ใช้เทคโนโลยีการมองเห็นคอมพิวเตอร์ โดยเฉพาะในการวิเคราะห์ภาพทางการแพทย์ ซึ่งจะดำเนินการสร้างภาพอวัยวะและเนื้อเยื่อเพื่อช่วยให้แพทย์สามารถวินิจฉัยได้อย่างรวดเร็วและแม่นยำ ส่งผลให้ผลการรักษาดีขึ้นและมีอายุขัยเฉลี่ยเพิ่มขึ้น ตัวอย่างเช่น
-
การตรวจหาเนื้องอกโดยการวิเคราะห์ไฝและแผลที่ผิวหนัง
-
การวิเคราะห์ด้วยการ X-Ray อัตโนมัติ
-
การตรวจพบอาการจากการสแกน MRI
คอมพิวเตอร์วิชันทำงานอย่างไร
ระบบการมองเห็นคอมพิวเตอร์ใช้เทคโนโลยีปัญญาประดิษฐ์ (AI) เพื่อเลียนแบบความสามารถของสมองมนุษย์ที่รับผิดชอบในการจดจำวัตถุและการจำแนกวัตถุ นักวิทยาศาสตร์คอมพิวเตอร์ได้ฝึกคอมพิวเตอร์ให้รู้จักข้อมูลภาพโดยการป้อนข้อมูลจำนวนมากเข้าไป อัลกอริทึมแมชชีนเลิร์นนิง (ML) จะระบุรูปแบบทั่วไปในภาพหรือวิดีโอเหล่านี้ และนำความรู้ดังกล่าวไปใช้ในการระบุภาพที่ไม่รู้จักได้อย่างถูกต้อง ตัวอย่างเช่น ถ้าคอมพิวเตอร์ประมวลผลภาพรถยนต์เป็นล้านภาพ ก็จะเริ่มสร้างรูปแบบอัตลักษณ์ที่สามารถตรวจจับยานพาหนะในภาพได้อย่างถูกต้อง วิสัยทัศน์คอมพิวเตอร์ใช้เทคโนโลยีเช่นที่ระบุไว้ด้านล่าง
ดีปเลิร์นนิง
การเรียนรู้เชิง ลึกเป็นประเภทของ ML ที่ใช้เครือข ่ายประสา ท นิวรัลเน็ตเวิร์กแบบดีปเลิร์นนิงถูกสร้างขึ้นจากโมดูลซอฟต์แวร์หลายชั้นที่เรียกว่าเซลล์ประสาทเทียมที่ทำงานร่วมกันภายในคอมพิวเตอร์ ซึ่งใช้ในการคำนวณทางคณิตศาสตร์เพื่อประมวลผลด้านต่างๆ ของข้อมูลภาพโดยอัตโนมัติ และค่อยๆ พัฒนาความเข้าใจร่วมกันของภาพ
นิวรัลเน็ตเวิร์คแบบสังวัตนาการ
เครือข่ายประสาทคอนโวลูชั่น (CNN) ใช้ ระบบการติดฉลากเพื่อจัด หมวดหมู่ข้อมูลภาพและเข้าใจภาพทั้งหมด ซึ่งจะวิเคราะห์ภาพเป็นพิกเซลและระบุค่าป้ายกำกับให้แต่ละพิกเซล โดยมีการป้อนค่าดังกล่าวเพื่อใช้ดำเนินการทางคณิตศาสตร์ที่เรียกว่าสังวัตนาการและใช้คาดการณ์เกี่ยวกับภาพ เช่นเดียวกับมนุษย์ที่พยายามจะรับรู้วัตถุในระยะไกล อันดับแรก CNN จะระบุเค้าร่างและรูปร่างที่เรียบง่ายก่อนที่จะป้อนรายละเอียดเพิ่มเติม เช่น สี รูปแบบภายใน และเนื้อสัมผัส จนท้ายที่สุดก็กลับมาดำเนินกระบวนการคาดการณ์ซ้ำอีกหลายครั้งเพื่อปรับปรุงความถูกต้องแม่นยำ
นิวรัลเน็ตเวิร์กแบบวนซ้ำ
นิวรัลเน็ตเวิร์กแบบวนซ้ำ (RN) คล้ายกับ CNN แต่สามารถประมวลภาพเป็นชุดเพื่อค้นหาความเชื่อมโยงระหว่างกันได้ ในขณะที่ CNN จะถูกใช้ในการวิเคราะห์ภาพเดียว แต่ RNN สามารถวิเคราะห์วิดีโอและทำความเข้าใจความสัมพันธ์ระหว่างภาพได้
คอมพิวเตอร์วิชันและการประมวลผลภาพแตกต่างกันอย่างไร
การประมวลผลภาพใช้อัลกอริทึมในการเปลี่ยนแปลงภาพ รวมถึงการลับคมชัดเรียบการกรองหรือการปรับปรุง คอมพิวเตอร์วิชันจึงแตกต่างออกไปเพราะมันไม่ได้ปรับเปลี่ยนภาพ แต่ทำความเข้าใจสิ่งที่เห็นและดำเนินงานแทน เช่น การติดป้ายกำกับ ในบางกรณี คุณสามารถใช้การประมวลผลภาพเพื่อปรับเปลี่ยนภาพเพื่อให้ระบบคอมพิวเตอร์วิชันสามารถเข้าใจภาพนั้นได้ดียิ่งขึ้น ในกรณีอื่น ๆ คุณใช้การมองเห็นด้วยคอมพิวเตอร์เพื่อระบุภาพหรือส่วนต่างๆของภาพ จากนั้นใช้การประมวลผลภาพเพื่อแก้ไขภาพเพิ่มเติม
งานทั่วไปที่คอมพิวเตอร์วิชันสามารถดำเนินการได้มีอะไรบ้าง
การจัดหมวดหมู่รูปภาพ
การจัดหมวดหมู่ภาพช่วยให้คอมพิวเตอร์มองเห็นภาพและสามารถจำแนกประเภทภาพนั้นๆ ได้อย่างถูกต้อง คอมพิวเตอร์วิชันเข้าใจประเภทและดำเนินติดป้ายกำกับ เช่น ต้นไม้ เครื่องบิน หรืออาคาร อีกตัวอย่างหนึ่งคือการที่กล้องสามารถจดจำใบหน้าในภาพถ่ายและโฟกัสไปที่ใบหน้าเหล่านั้นได้
การตรวจจับวัตถุ
การตรวจจับวัตถุเป็นงานของคอมพิวเตอร์วิชันในการตรวจจับและการแปลภาพ โดยใช้การจำแนกประเภทเพื่อระบุ เรียงลำดับ และจัดระเบียบภาพ การตรวจจับวัตถุถูกใช้ในกระบวนการอุตสาหกรรมและการผลิตเพื่อควบคุมการใช้งานที่เป็นอิสระและตรวจสอบสายการผลิต นอกจากนี้ ผู้ผลิตกล้องสำหรับใช้ในบ้านและผู้ให้บริการที่เชื่อมโยงกันยังต้องพึ่งพาการตรวจจับวัตถุในการประมวลผลการสตรีมวิดีโอสดจากกล้องเพื่อตรวจจับผู้คนและวัตถุแบบเรียลไทม์ และดำเนินการแจ้งเตือนที่ใช้ได้จริงแก่ผู้ใช้ปลายทางของพวกเขา
การติดตามวัตถุ
การติดตามวัตถุจะใช้โมเดลดีปเลิร์นนิงในการระบุและติดตามสิ่งที่อยู่ในหมวดหมู่ต่างๆ โดยมีการใช้งานจริงในหลายอุตสาหกรรม องค์ประกอบแรกของการติดตามวัตถุคือการตรวจจับวัตถุ โดยจะมีการสร้างกรอบแสดงขอบเขตรอบวัตถุ กำหนด ID ของวัตถุ จากนั้นจึงสามารถติดตามวัตถุดังกล่าวผ่านเฟรมได้ ตัวอย่างเช่น การติดตามวัตถุสามารถใช้ในการตรวจสอบการจราจรในสภาพแวดล้อมในเมือง การเฝ้าระวังมนุษย์ และการถ่ายภาพทางการแพทย์
การแบ่งส่วน
การแบ่งส่วนเป็นอัลกอริทึมของคอมพิวเตอร์วิชันที่จะระบุวัตถุโดยแบ่งภาพในระบบออกเป็นส่วนต่างๆ ตามพิกเซลที่เห็น นอกจากนี้ การแบ่งส่วนยังช่วยลดความซับซ้อนของภาพ เช่น การวางรูปร่างหรือเค้าร่างของวัตถุเพื่อกำหนดว่ามันคืออะไร ซึ่งเมื่อทำเช่นนั้นแล้ว การแบ่งส่วนจึงทำให้รับรู้ได้ว่ามีวัตถุมากกว่าหนึ่งรายการในภาพหรือเฟรมนั้นๆ
ตัวอย่างเช่น ถ้ามีแมวและสุนัขอยู่ในภาพ ก็สามารถใช้การแบ่งส่วนในการรับรู้สัตว์สองตัวได้ ซึ่งแตกต่างจากการตรวจจับวัตถุที่มีการสร้างกรอบรอบวัตถุ การแบ่งส่วนจะตรวจตามพิกเซลเพื่อหารูปร่างของวัตถุ ทำให้สามารถวิเคราะห์และติดป้ายกำกับได้ง่ายขึ้น
AWS ช่วยงานด้านคอมพิวเตอร์วิชันของคุณอย่างไรบ้าง
AWS มอบชุดบริการปัญญาประดิษฐ์และแมชชีนเลิร์นนิง (AI/ML) ที่ครบถ้วนและสมบูรณ์ที่สุดซึ่งเชื่อมต่อกับแหล่งที่มาของข้อมูลที่ครอบคลุมเพื่อลูกค้าในทุกระดับความเชี่ยวชาญ
สำหรับลูกค้าที่ใช้เฟรมเวิร์กและจัดการโครงสร้างพื้นฐานของตนเอง เราเพิ่มประสิทธิภาพเวอร์ชันของกรอบการเรียนรู้เชิงลึกที่ได้รับความนิยมมากที่สุด รวมถึง PyTorch , MXnet และ TensorFlow AWS มีพอร์ ตโฟลิโอที่กว้างและลึก ซึ้งของบริการ ML โครงสร้างพื้นฐานด้านการประมวลผล เครือข่าย และพื้นที่จัดเก็บข้อมูล พร้อมตัวเลือกโปรเซสเซอร์และตัวเร่งเพื่อตอบสนองความต้องการด้านประสิทธิภาพและงบประมาณที่ไม่เหมือนใคร
สำหรับลูกค้าที่ต้องการสร้างโซลูชันการมองเห็นคอมพิวเตอร์มาตรฐานทั่วทั้งธุรกิจ Amazon SageMaker ช่วยให้เตรียมข้อมูลและสร้าง ฝึกอบรม และปรับใช้โมเดล ML สำหรับทุกกรณีการใช้งานด้วยโครงสร้างพื้นฐาน เครื่องมือ และเวิร์กโฟลว์ที่มีการจัดการอย่างสมบูรณ์ รวมถึงข้อเสนอแบบไม่มีรหัสสำหรับผู้วิเคราะห์ธุรกิจ
สำหรับลูกค้าที่ยังขาดทักษะด้าน ML และต้องการออกสู่ตลาดเร็วขึ้น หรือต้องการเพิ่มความอัจฉริยะให้กับกระบวนการหรือแอปพลิเคชันที่มีอยู่ AWS ขอนำเสนอบริการคอมพิวเตอร์วิชันแบบ ML ที่หลากหลาย บริการเหล่านี้ช่วยให้คุณเพิ่มความฉลาดให้กับแอปพลิเคชัน AI ของคุณได้อย่างง่ายดายผ่าน API ที่ผ่านการฝึกล่วงหน้ามาแล้ว Amazon Rekognition ทำการ วิเคราะห์ภาพและวิดีโอของคุณโดยอัตโนมัติด้วย ML และวิเคราะห์รูปภาพ สตรีมสด และวิดีโอที่เก็บไว้หลายล้านรายการในไม่กี่วินาที
เริ่มต้นใช้งานวิสัยทัศน์คอมพิวเตอร์โดยการสร้างบัญช ี AWS ฟรีวันนี้