نرم افزارهای موجود در ماشین لرنینگ، نیاز به ریاضیات را تا حدود زیادی کم می کند همچنان که نرم افزارهای حسابداری نیز عملیات مختلف ریاضی مورد نیاز در حسابداری را انجام می دهند ولی یک حسابدار باید با ریاضیات مقدماتی آشنا باشد و در یادگیری ماشین هم آشنایی مقدماتی با برخی مفاهیم انتزاعی ریاضیات برای فهم بیشتر الگوریتم ها و مخصوصا برای توسعه دهندگان الگوریتم ها مورد نیاز است.

از جمله دروس ریاضی مورد نیاز در یادگیری ماشین می توان به جبر خطی اشاره کرد البته نه به صورت پیچیده ای که در برخی کتب دانشگاهی جبرخطی مطرح می شود. مباحث ریاضی مورد نیاز در یادگیری ماشین را به اقتضای نیاز و در زمان نیاز باید فرا گرفت. اگر بخواهید ابتدا در ریاضیات قوی بشوید و بعد به کاربردهای آن در دیگر رشته ها بپردازید بسیار مسیر طاقت فرسایی را خواهید رفت مسیری که دانشگاه ها طی می کنند همین است متاسفانه و اغلب به مقصد خوبی نمی رسد شاهد زنده: حجم عظیم فارغ التحصیلان دانشگاهی با اندکی مهارت و بینش مهندسی و طراحی و حل مسائل واقعی!

مینیمم های ریاضیات در یادگیری ماشین:

از جمله مطالبی که در یادگیری ماشین به فهم روندها کمک می کند ایده های ساده و اصلی جبرخطی است (بردارها، پایه ها، ماتریس ها، تجزیه ماتریس ها، خصوصا SVD، …). درست می گویند که جبر خطی ریاضیات قرن ۲۱ است. جبر خطی در قسمت های زیادی از ماشین لرنینگ حضور دارد به ویژه در تجزیه مقدار اصلی principal value decomposition، تجزیه مقدار منفرد singular value decomposition، تجزیه LU، تجزیه QR، پایه های متعامد، … در واقع این مباحث در سرفصل درس جبر خطی عددی بیشتر می گنجد تا در درس جبرخطی. جبر خطی را می توانید از مطالب دانشگاه ام آی تی در این لینک مطالعه کنید (پروفسور گیلبرت استرنگ).

تدریس خصوصی جبر خطی و جبر خطی عددی          تدریس جبر خطی و جبر خطی عددی و مبانی ماتریس ها و جبر خطی

موضوع مهم دیگر آمار و نظریه احتمال است مباحث زیر

ترکیبیات، قوانین احتمال، نظریه بیز، متغیرهای تصادفی، واریانس و امید ریاضی، توزیع های شرطی، توزیع های استاندارد (برنولی، چندجمله ای، یکنواخت و گاوسی)، توابع مولد اینرسی، ….

Combinatorics, Probability Rules & Axioms, Bayes’ Theorem, Random Variables, Variance and Expectation, Conditional and Joint Distributions, Standard Distributions (Bernoulli, Binomial, Multinomial, Uniform and Gaussian), Moment Generating Functions, Maximum Likelihood Estimation (MLE), Prior and Posterior, Maximum a Posteriori Estimation (MAP) and Sampling Methods.

موضوع مهم دیگر حسابان چندمتغیره (ریاضی عمومی ۲) است: مشتقات جزئی، مشتق سویی، بردار گرادیان، لاپلاسین، روش ضرایب لاگرانژ و … به صورت مفهومی

و در آخر الگوریتم های بهینه سازی (برنامه ریزی غیرخطی)

اینها ریاضیاتی است که در یادگیری ماشین احتمالا برخورد می کنید.

مطالب فوق ترجمه آزاد از این سایت