بینایی ماشین و آموزش پروژه محور با پایتورچ

تعداد جلسات :

37 جلسه

مدت دوره :

در حال انتشار (تا کنون 11 جلسه منتشر شده است)

تهیه و دانلود جزوه متنی تصویری

دكتر روح الله ديانت

ویدیو معرفی
وضعیت فعلی
ثبت‌نام نشده
قیمت
1950 هزار تومان
شروع کنید

 

بینایی ماشین (Machine vision) یا بینایی کامپیوتر (Computer vision) چیست؟ در این مقدمه، به این سؤال و دو سؤال مهم دیگر زیر پاسخ خواهیم داد.

سؤال دوم: مخاطب این دوره چه افرادی هستند و چه پیش‏‌نیازهایی را باید بدانند؟

سؤال سوم:  محتوای کلی دوره شامل چه مباحثی است؟

پاسخ سؤال اول: 

تعریف “بینایی ماشین”

بینایی ماشین، شاخه ای از “یادگیری ماشین” (Machine learning) است که این موضوع نیز، شاخه‏‌ای مهم از هوش مصنوعی (Artificial intelligence) می‏‌باشد. هوش مصنوعی نیز با مفهومی به نام “هوش طبیعی” (Natural intelligence) مرتبط است. با توجه به این ارتباط، بیاییم از تعریف هوش طبیعی شروع کرده و در نهایت به تعریف بینایی ماشین برسیم.

هوش طبیعی: به مجموعه قابلیت‏های دریافت (Sensing) ، درک (Understandingیادگیری (Learningپردازش (Processing) و تصمیم‏‌گیری (Decision making) که در انسان و سایر موجودات وجود دارد، هوش طبیعی گفته می‏‌شود.

هوش مصنوعی : به  تقلید (Mimic) (بخشی یا همه) قابلیت های هوش طبیعی توسط ماشین گفته می شود.

یادگیری ماشین: امروزه قسمت اعظم بهره گیری از هوش مصنوعی در قالب یادگیری ماشین انجام می شود که بخش یادگیری، برجسته است.

بینایی ماشین: همان یادگیری ماشین است که داده‏‌های ورودی آن از جنس تصویر یا ویدئو می‏‌باشد.

امروزه همگان با اهمیت فوق العاده “هوش مصنوعی” آشنا هستیم. موضوعاتی مانند سامانه‏‌های پرسش و پاسخ متنی (ChatGPT، Bard و…)، تبدیل متن به تصویر یا ویدئو و… که بسیار پررونق شده و حتی وارد زندگی روزمره مردم عادی شده است. بسیاری از صاحب‌نظران، هوش مصنوعی را از ارکان مهم (و شاید مهم‏ترین رکن) انقلاب صنعتی چهارم می‏دانند.

در تعاریف بالا، مشخص کرده‏‌ایم که بینایی ماشین یکی از مهم‌‏ترین موضوعات مطرح در هوش مصنوعی است. اغلب افراد، ناخودآگاه یا با علم و اطلاع، تجربه‏‌ای در مورد سامانه‌های بینایی ماشین داشته‌‏اند. برای رانندگانی که جریمه شده‏‌اند، سامانه‏‌های تشخیص پلاک (که بر مبنای تصاویر گرفته شده توسط دوربین‌ها، شماره پلاک را تشخیص می‏‌دهند) جزء دردآورترین سامانه‏‌هاست. این سامانه، مثال واضحی از یک ماژول بینایی ماشین است. ماژول‏های تشخیص و شناسایی چهره و یا تشخیص اثر انگشت، نمونه‏‌های دیگری از سامانه‏‌های بینایی ماشین به‌شمار می‏‌روند.

تعریف دقیق‌تر بینایی ماشین در جلسه اول دوره، به تفصیل بیان می‌شود.

پاسخ سؤال دوم:

مخاطبین دوره بینایی ماشین و پیش‏‌نیازهای لازم

یکی از ویژگی‏‌های مهم این دوره، که آن را از خیلی دوره‌‏های مشابه، متمایز ساخته، وجود حداقل پیش‌‏نیاز لازم برای شروع دوره است. مشخصاً تنها پیش‌‏نیاز لازم، آشنایی با یک زبان برنامه‌نویسی شیء گرا (هر زبانی) و دارابودن دانش کلی در رابطه با مفاهیمی مثل کلاس، شیءگرایی، ارث بری و… می‏‌باشد. در این دوره با زبان برنامه‌‏نویسی Python و کتابخانه‏‌هایی مانند Pytorch کار می‏‌کنیم و تقریبا همه موارد مربوط به برنامه‌نویسی با این دو ابزار و ابزارهای فرعی دیگر، در خود دوره آموزش داده می‏‌شود و لذا دانستن قبلی آنها، اجباری نیست. البته واضح است افرادی که با این نوع مفاهیم آشنا باشند می‏‌توانند مطالب را سریع‏‌تر و عمیق‏‌تر بیاموزند.

ویژگی مهم دیگر این دوره، کاربردی بودن آن است. در ابتدای دوره، دو پروژه کاملا کاربردی و واقعی تعریف می‌کنیم و در طول دوره، این دو پروژه را از ابتدا تا انتها انجام می‌دهیم. این امر، استفاده کننده از دوره را قادر می‏‌سازد تا در انتهای دوره، بتواند پروژه‏‌های مشابهی در حوزه بینایی ماشین را انجام دهد.

البته لازم به ذکر است این توجه اساسی به کاربرد، باعث نشده است که از بیان تئوری های لازم، غافل شویم و در موارد متعدد، این تئوری‏‌ها به نحو نسبتاً جامعی پوشش داده شده است.

وجود کمترین پیش‌‏نیازهای ممکن، منجر شده که مخاطبین این دوره، طیف وسیعی از دانشجویان و علاقه‌مندان باشند. دانشجویان رشته‏‌های مهندسی و علوم کامپیوتر و همچنین فناوری‌اطلاعات (کارشناسی ترم 4 ام به بعد، کارشناسی ارشد و دکتری)، می‏‌توانند از این دوره به نحو بسیار مناسبی استفاده کنند. به علاوه دانشجویان رشته‏‌های دیگر فنی و علوم پایه که با موضوع برنامه نویسی شیء گرا آشنا هستند نیز می‏‌توانند از دوره بهره‌ی لازم را ببرند.

پاسخ سؤال سوم:

محتوای کلی دوره

برای طراحی یک سامانه‌ی بینایی ماشین، 5 مرحله آماده سازی داده (Data preparationطراحی مدل (Model designآموزش (Trainingارزیابی (Evaluation) و بکارگیری (Deployment) را باید انجام دهیم. توضیح هر یک از این مراحل را در جلسه اول دوره آورده‌ایم و در این‌جا به آن نمی‌‏پردازیم. در این دوره، دو پروژه عملیاتی (“تشخیص ارقام دست نویس” و “تشخیص چهره“) تعریف شده و نحوه انجام این 5 مرحله، به تفصیل و به صورت کاملا کاربردی روی این دو موضوع، توضیح داده می‏‌شود. با توجه به آنکه امروزه تقریبا کلیه الگوریتم‏‌های مطرح در بینایی ماشین مبتنی بر شبکه‏‌های عصبی عمیق (Deep neural networks) یا DNNها هستند، روی طراحی سامانه‏‌های بینایی ماشین در این حوزه، تمرکز خواهد شد.

در انتهای دوره،  دو پروژه یادشده را به صورت کامل در اختیار خواهیم داشت. نکته مهم و قابل توجه آن است که در پپاده سازی‏‌های انجام شده نکاتی مفید در مورد برنامه نویسی بهینه (بخصوص از نظر زمان اجرا) بیان کردیم و این امر منجر شده که هر دو پروژه، زمان اجرای بسیار مناسب و سریعی داشته باشند و بتوانند در کاربردهای واقعی مورد استفاده قرار گیرند.

کلام آخر

تا اینجا نگاه کلی به حوزه‌ی بینایی ماشین، مخاطبان و پیش‌نیازهای آن داشتیم. محتوای کلی دوره و پروژه‌های پیاده‌سازی‌شده در طول دوره را مطرح کردیم تا با آشنایی کامل وارد دوره شوید. البته پیشنهاد ما اینست که برای درک سریعتر مطالب، دوره هوش مصنوعی دکتر روح الله دیانت که به صورت کامل در مجموعه مهارت‌های استارت‌آباد قرارگرفته را مطالعه کنید.

حالا نوبت شماست که سوال های خود را در مورد دوره ازما بپرسید و با پیش ثبت‌نام در آن، از تخفیفات دوره بهره مند شوید 🙂

محتوای دوره

موضوع و هدف دوره
فراهم سازی داده
طراحی (ساخت) مدل / در حال تولید
آموزش / در حال تولید
ارزیابی / در حال تولید
بکارگیری / در حال تولید
::: دوره‌های مفید دیگر :::