گھر کاروبار مشین سیکھنے میں کامیابی کے لئے 7 نکات

مشین سیکھنے میں کامیابی کے لئے 7 نکات

فہرست کا خانہ:

ویڈیو: دس فنی لمØات جس ميں لوگوں Ú©ÛŒ کيسے دوڑيں لگتی ہيں ™,999 فنی (اکتوبر 2024)

ویڈیو: دس فنی لمØات جس ميں لوگوں Ú©ÛŒ کيسے دوڑيں لگتی ہيں ™,999 فنی (اکتوبر 2024)
Anonim

مشین لرننگ (ایم ایل) سے متعلق ہمارے بزنس گائیڈ کے پہلے حصے نے یہ توڑ دیا کہ کس طرح ایم ایل کا چھتری کا تصور کاروباری ماحول میں اس سے کہیں زیادہ اہمیت کا حامل ہے۔ انتہائی مؤثر حکمت عملی ایم ایل کو عملی معنوں میں دیکھتی ہے ، جس میں انٹرپرائز کے عمل کو بہتر بنانے اور ٹھوس بزنس انٹیلیجنس (BI) بصیرت حاصل کرنے کے ل complex پیچیدہ گہری سیکھنے اور کم گہری "سستے سیکھنے" دونوں تکنیکوں کو ملازمت فراہم کی جاتی ہے۔

آپ کے کاروباری ایپلی کیشنز میں ایم ایل کی تعیناتی کا مقصد اپنی نچلی لائن کو بہتر بنانا ہے یا اپنی کمپنی کا مسابقتی فائدہ دبائیں۔ لیکن آپ کی تنظیم کی بڑی اسکیم میں ، اس عمل میں جس وقت آپ اور سرمایہ کاری کرتے ہیں اس میں زیادہ سے زیادہ فائدہ اٹھانا الگورتھم سے کہیں آگے ہے۔ آپ کے کاروبار میں آئی ٹی فیصلہ سازوں کو یہ یقینی بنانا ہوگا کہ آپ کے ایم ایل ایمپیمینٹیشن میں ہر چیز کی فیکٹرنگ کو یقینی بنائیں - ڈیٹا اور لاجسٹک سے لے کر کہ آپ صارفین کے ساتھ کس طرح مشغول ہیں effectiveness تاثیر کو بڑھانے کے لئے باہم مل کر کام کریں۔

ٹیڈ ڈننگ ، پی ایچ ڈی ، میپآر میں چیف ایپلی کیشن آرکیٹیکٹ ہے ، ایک انٹرپرائز سافٹ ویئر کمپنی ہے جس میں بگ ڈیٹا کی مختلف تقسیم اور ڈیٹا مینجمنٹ ٹولز پیش کرتے ہیں۔ ڈننگ نے اس کے بارے میں دو کتابیں بھی تصنیف کیں جنھیں وہ "پریکٹیکل مشین لرننگ" کہتے ہیں اور گذشتہ سالوں میں متعدد کمپنیوں کے لئے ایم ایل ٹیکنالوجیز تیار کیں ، جن میں شناختی تجزیات کے فراڈ کا پتہ لگانے والا نظام (لائف لاک کے ذریعہ خریدا گیا) اور میوزک میٹ جک باکس سافٹ ویئر ، جو بعد میں یاہو میوزک بن گیا۔ اس وقت وہ اپاچی سافٹ ویئر فاؤنڈیشن کے انکیوبیشن کے نائب صدر کی حیثیت سے بھی خدمات انجام دے رہے ہیں۔

ڈننگ نے کئی دہائیوں کے دوران ایم ایل کی جگہ تیار ہوتے ہوئے دیکھا ہے ، اور اس کے بارے میں بہت کچھ سیکھا ہے کہ عملی کاروباری ماحول میں کیا کام کرتا ہے اور کیا نہیں۔ ذیل میں ، ڈننگ نے ایم ایل میں جڑے ہوئے کاروباری حلوں کی نشوونما کرتے وقت اس پر عمل کرنے کے لئے سات بہترین طریق کار وضع کیے ہیں۔

1. لاجسٹکس مت بھولنا

کامیاب ایم ایل صرف صحیح آلے یا الگورتھم کے انتخاب کے بارے میں نہیں ہے۔ ڈننگ نے کہا کہ آپ کو یہ بھی جاننے کی ضرورت ہے کہ کون سا نقطہ نظر اچھا ہے اور اسے جس خاص صورتحال سے نمٹا رہے ہو اس کے لئے اسے ڈیزائن کریں۔ مثال کے طور پر ، ڈننگ نے کسی زیادہ خودمختار کار کی رہنمائی کرنے والے الگورتھم جیسے پیچیدہ منظرناموں کے برخلاف ، آن لائن مارکیٹنگ مہم میں ایم ایل کے بارے میں بات کی۔ اضافی الگورتھم بہتری کے ل your اپنے وسائل کا خرچ کار کے ل for مصیبت کے قابل ہے ، لیکن مارکیٹنگ کے منظر نامے میں ، آپ کو اس کے آس پاس کے تمام لاجسٹکس کو بہتر بنانے سے کہیں زیادہ بہتر واپسی نظر آئے گی۔

ڈننگ نے کہا ، "اکثر اوقات ، کاروبار کے لئے ، یہ لاجسٹکس ہوتا ہے ، نہ کہ سیکھنے کی ، جو آپ کو اہمیت دیتی ہے۔ یہی وہ حصہ ہے جس پر آپ کو اپنا وقت اور وسائل خرچ کرنا چاہ.۔" "الگورتھم کو ایڈجسٹ کرنے سے آپ کو تھوڑی بہت بہتری ملے گی۔ لیکن اس ڈیٹا ، GUI کو ایڈجسٹ کرنا ، اور آپ اپنے صارفین کے ساتھ سننے اور اس سے منسلک ہونے سے آسانی سے آپ کو 100 فیصد بہتری دے سکتے ہیں۔ الگورتھم کو ٹویٹ کرنے میں وقت صرف کرنے کے قابل ہے کیونکہ کاروبار کو بہت کچھ ہے جیسا کہ آپ کے صارفین کو سن رہا ہے۔ "

اس نکتہ کی مثال کے طور پر ، ڈننگ نے وضاحت کی کہ کس طرح اس نے کسی کمپنی کے کسٹمر ڈیٹا بیس میں درخواست کی دھوکہ دہی (چوری شدہ شناختوں کے ساتھ جعلی اکاؤنٹ کھولنے) کی نشاندہی کرنے کے لئے ایک ماڈل بنایا تھا۔ اس کے بنائے ہوئے ماڈل کے بہت اچھے نتائج برآمد ہوئے ، لیکن ڈننگ نے محسوس کیا کہ اس نے درخواست دہندہ کی صنف کو بہت زیادہ وزن کیا ہے۔

پتہ چلا کہ رسد بند ہے۔ جس طرح سے درخواست کے عمل نے کام کیا ، درخواست دہندہ نے صرف اس کے بعد ہی وہ ان کی جنس کو پُر کیا جب وہ پہلے ہی گاہک بن چکے تھے اور جعلسازوں کو فلٹر کرنے کے لئے اسکریننگ کے متعدد اقدامات منظور کر چکے تھے۔ لہذا صنفی فیلڈ کا استعمال کرکے ، ایم ایل ماڈل دھوکہ دہی کے پورے عمل کی رسد کو دھوکہ دے رہا تھا۔ اس کا الگورتھم سے کوئی لینا دینا نہیں ہے ، اور اس سے ہر کام کرنا ہے کہ کمپنی اپنے اعداد و شمار کو پہلی جگہ کس طرح حاصل کررہی تھی۔

2. اپنے ڈیٹا کو ذہن میں رکھیں

ڈنکنگ حکمت کی دلکش تبصروں سے بھری ہوئی ہے۔ "یہ لاجسٹکس ہے ، سیکھنے کی نہیں ،" کے ساتھ شروع کرنے کے بعد ، انہوں نے کہا کہ اس خیال کا باقی آدھا حصہ "یہ ڈیٹا ہے ، الگورتھم نہیں ہے۔" آپ کے ایم ایل الگورتھم کو یقینی بنانے کا ایک بہت بڑا حصہ قیمتی بصیرت کی فراہمی کو یقینی بنارہا ہے کہ آپ انہیں صحیح ڈیٹا کھلا رہے ہیں۔ ڈننگ نے کہا ، اگر آپ کو نتیجہ نہیں مل رہا ہے جس کے لئے آپ ڈھونڈ رہے ہیں تو زیادہ تر اس کی وجہ یہ نہیں ہے کہ آپ صحیح اعداد و شمار کا استعمال نہیں کررہے ہیں۔

ڈننگ نے کہا ، "لوگ خاص طور پر الگورتھم کا پابند ہوجاتے ہیں ، لیکن آج کل ، وہاں کے اوزاروں کی وجہ سے ، ہر ایک اور ان کی والدہ کر سکتے ہیں اور ہر طرح کے نئے الگورتھم لے کر آ رہے ہیں۔" "اعداد و شمار کہیں زیادہ اہم ہیں ، اور آپ کو اپنے الگورتھم کو متناسب ٹویٹ کرنے سے کہیں زیادہ لفٹ دیں گے۔ اگر آپ تقریر کی شناخت یا کمپیوٹر وژن جیسے مشکل مسئلے پر کام کر رہے ہیں تو ، یہ ایک چیز ہے۔ لیکن یہ ڈیٹا پر مبنی فیلڈ ہے۔ اکثریت کے منظرناموں میں ، آپ کو کون سا ڈیٹا مل رہا ہے اور سوال کو تبدیل کرنے سے آپ کو کہیں زیادہ فائدہ ہوگا۔ "

وہو نیٹ ورکس نامی کمپنی میں ویڈیو سفارش انجن کی تعمیر کے وقت 2000 کے وسط میں ڈننگ نے یہی کام کیا۔ ٹیم صارف کے ذریعے تیار کردہ ویڈیوز کے جوڑے کی شناخت کے لئے کام کر رہی تھی جس پر لوگوں نے توقع سے زیادہ پر کلک کیا ، لیکن الگورتھم کام نہیں کر رہا تھا۔ وہ موسیقی کے حوالے سے سوچ رہے تھے ، جہاں صارف اپنے پسندیدہ فنکاروں اور گانوں کو نام سے جانتے ہیں۔ تو انہوں نے خود الگورتھم کو چھوئے بغیر یوزر انٹرفیس کو ٹویٹ کرکے سوال کو تبدیل کردیا۔

ڈننگ نے کہا ، "صارف کے ذریعے تیار کردہ ویڈیوز میں ، کوئی بھی فنکاروں کو نہیں جانتا ہے اور بہت ساری ویڈیوز میں زیادہ سے زیادہ نظارے حاصل کرنے کے ل really واقعی سپیمی عنوانات تھے۔ الگورتھم ٹویکس پر سائیکل چلانے سے ہمیں کبھی اچھے نتائج نہیں مل پاتے۔" "ہم نے جو کیا وہ صارف انٹرفیس کو ہر 10 سیکنڈ میں بیکن سگنل کا اخراج کرنے کے لئے تبدیل کر دیا گیا تھا۔ ہم نے محسوس کیا ہے کہ اگر ہم نے سفارش کنندہ کے خام اعداد و شمار کے لئے کلکس کی بجائے بیکن کا استعمال کیا تو ہمیں حیرت انگیز نتائج برآمد ہوئے۔ اس تبدیلی کی لفٹ کئی تھی۔ الگورتھمک تبدیلیوں کے بغیر ، سفارشات کی وجہ سے مصروفیات میں سو فیصد بہتری۔

3. الگورتھم جادو گولیوں نہیں ہیں

ایم ایل کے نفاذات مستقل آزمائش اور غلطی پر ترقی کرتے ہیں۔ اس سے کوئی فرق نہیں پڑتا ہے کہ آپ کے الگورتھم کتنے اچھے ہیں ، اگر آپ کا سسٹم انسانوں کے ساتھ تعامل کر رہا ہے ، تو پھر اسے وقت کے ساتھ ایڈجسٹ کرنے کی ضرورت ہوگی۔ ڈننگ نے زور دے کر کہا کہ کاروباری اداروں کو ان کے نفاذ کی مجموعی تاثیر کو مستقل طور پر ناپنا چاہئے ، اور ان تبدیلیوں اور متغیرات کی نشاندہی کرنا چاہئے جو اسے بہتر بنا رہے ہیں اور اسے خراب تر بنا رہے ہیں۔ یہ ایک فریب دہی کی طرح محسوس ہوسکتا ہے ، لیکن ڈننگ نے کہا ، یہ کتنا ہی واضح معلوم ہوتا ہے ، بہت کم لوگ یہ کررہے ہیں یا اسے اچھی طرح سے کررہے ہیں۔

ڈننگ نے کہا ، "بہت سارے لوگ ایک نظام کی تعیناتی کرنا چاہتے ہیں یا کچھ کارروائی کرنا چاہتے ہیں ، اور وہ چاہتے ہیں کہ ان کا الگورتھم ہمیشہ کے لئے کامل طور پر چلتا رہے۔" "کوئی الگورتھم جادوئی گولی نہیں بننے والا ہے۔ کسی بھی صارف کے انٹرفیس ڈیزائن کو ہمیشہ کے لئے قائم نہیں رکھا جائے گا۔ کسی بھی ڈیٹا اکٹھا کرنے کا طریقہ کبھی بھی مسترد نہیں ہوگا۔ یہ سب کچھ ہوسکتا ہے اور ہوسکتا ہے ، اور کاروباریوں کو چوکس طریقے سے پیمائش ، تشخیص اور دوبارہ جانچنے کی ضرورت ہے کہ ان کے نظام کام کرتا ہے۔ "

4. ایک متنوع ٹولسیٹ استعمال کریں

یہاں ایم ایل کے درجنوں اوزار دستیاب ہیں ، جن میں سے بہت سے آپ مفت میں استعمال کرسکتے ہیں۔ آپ کو اوپن سورس فریم ورک لائبریریاں مل گئی ہیں جیسے کیفی ، ایچ 20 ، شوگن ، ٹینسرفلو ، اور مشعل ، اور ایماوئٹ لائبریریاں جو اپاچی سافٹ ویئر فاؤنڈیشن (اے ایس ایف) میں مہوت ، سنگا اور اسپارک شامل ہیں۔ پھر سبسکرپشن پر مبنی آپشنز موجود ہیں جن میں ایمیزون مشین لرننگ ، بگ ایم ایل ، اور مائیکروسافٹ آزور مشین لرننگ اسٹوڈیو شامل ہیں۔ مائیکروسافٹ کے پاس ایک مفت علمی ٹول کٹ بھی ہے۔

بے شمار وسائل دستیاب ہیں۔ ڈننگ نے متعدد کاروبار ، ڈیٹا سائنسدانوں ، اور ایم ایل پریکٹیشنرز سے بات کی ہے اور ہمیشہ ان سے پوچھتے ہیں کہ وہ کتنے مختلف فریم ورک اور اوزار استعمال کرتے ہیں۔ اوسطا ، ڈننگ نے کہا کہ بیشتر نے کہا کہ وہ کم سے کم 5-7 ٹولز استعمال کرتے ہیں اور اکثر اس سے کہیں زیادہ۔

ڈننگ نے کہا ، "آپ کسی ایک آلے سے چپکے نہیں ہو سکتے۔ آپ کو متعدد استعمال کرنے پڑیں گے ، اور اس طرح آپ اپنے نظام کو اس طرح سے بہتر بناتے کہ یہ اجنسٹک ہے۔" "جو بھی شخص آپ کو یہ باور کرانے کی کوشش کرتا ہے کہ یہ آلہ صرف وہی ہے جس کی آپ کو ضرورت ہوگی وہ آپ کو سامان کا بل فروخت کرنا ہے۔

ڈننگ نے مزید کہا ، "اگلے ہفتے کچھ ایسا ہوسکتا ہے جو سیب کی ٹوکری کو پریشان کردے ، اور جدت کی شرح جس پر ہم دیکھ رہے ہیں ، کم سے کم پانچ سے 10 سال تک ہوتا رہے گا۔" "ایک سستے سیکھنے کی مثال دیکھو جہاں ہوسکتا ہے کہ آپ کسی کیٹلوگ میں تصاویر کا تجزیہ کرنے کے لئے کسی موجودہ تصویری درجہ بندی کو دوبارہ استعمال کر رہے ہو۔ کمپیوٹر وژن کے ساتھ یہ گہری تعلیم ہے۔ لیکن وہاں ایسے ٹولز موجود ہیں جنہوں نے یہ سب پیک کیا ہے۔ آپ کو ضرورت ہے مختلف ٹولوں کے درمیان پیمائش ، تشخیص ، اور خالی جگہ بنانے کے ل and ، اور آپ کے بنیادی ڈھانچے کو اس کا خیرمقدم کرنے کی ضرورت ہے۔ "

5. ہائبرڈ لرننگ کے ساتھ استعمال کریں

ڈننگ نے کہا کہ آپ سستے اور گہری سیکھنے کو بھی ہائبرڈ کی کسی چیز میں ملا سکتے ہیں۔ مثال کے طور پر ، اگر آپ موجودہ کمپیوٹر وژن کا نمونہ لیں اور اوپری چند پرتوں کو دوبارہ تعمیر کریں جہاں فیصلہ کیا جارہا ہے ، تو آپ مکمل طور پر نئے استعمال کے معاملے میں موجودہ فریم ورک کا انتخاب کرسکتے ہیں۔ ڈننگ نے ایک کاگل مقابلہ کی طرف اشارہ کیا جس میں مقابلہ کرنے والوں نے ایسا ہی کیا تھا۔ انہوں نے ڈیٹا سیٹ لیا اور اوپر سے ایک نیا الگورتھم لکھا ، تاکہ کمپیوٹر کو بلیوں کو کتوں سے تمیز کرنے میں مدد ملے۔

"ایم ایل الگوریتم کے لئے بلیوں اور کتوں کی تمیز کرنا ایک بہت ہی لطیف چیز ہے۔ اس منطق کے بارے میں سوچو: بلیوں کے کان نمایاں ہوتے ہیں لیکن جرمن شیفرڈس کے بھی ہیں۔ کتے کے بھی دھبے نہیں ہوتے ہیں ، سوائے دالماٹیاں وغیرہ کے۔ یہ پہچاننا مشکل ہے۔ میں اور خود ہی ، "ڈننگ نے کہا۔ "جس لڑکے نے جیت لیا اس نے ایک ایسا نظام تیار کیا جس نے percent 99 فیصد درستگی کے ساتھ یہ کام کیا۔ لیکن میں اس شخص سے زیادہ متاثر ہوا جو تیسرے نمبر پر آیا تھا۔ شروع سے ہی عمارت بنانے کی بجائے اس نے ایک مختلف کام سے امیج کو پہچاننے کا ایک موجودہ پروگرام لیا ، اوپری پرت ، اور وہاں ایک سادہ درجہ بند رکھنے والا۔ اس نے اس کی کچھ مثالیں پیش کیں ، اور جلد ہی ، کتوں سے بلیوں کو فرق کرنے میں یہ 98 فیصد درست تھا۔ پورے عمل میں لڑکے کو تین گھنٹے لگے۔ "

6. سستے کا مطلب برا نہیں ہے

واضح الفاظ کے باوجود ، ڈننگ نے کہا کہ سستے سیکھنے کا مطلب برا سیکھنا نہیں ہے۔ آپ ایم ایل کے نفاذ پر کتنا وقت خرچ کرتے ہیں جو اس کی کاروباری قیمت سے براہ راست نہیں منسلک ہوتا ہے۔ انہوں نے کہا ، سب سے اہم معیار یہ ہے کہ اس بات کو یقینی بنائیں کہ عمل دہرا repeat اور قابل اعتماد ہے۔ اگر کاروبار غیر ضروری وسائل کی سرمایہ کاری کے بغیر اس کو حاصل کرنے میں کامیاب ہے ، تو یہ سب سے بہتر ہے۔

ڈننگ نے کہا ، "سستے ہونے کا مطلب برا نہیں ہے۔ اگر یہ کام کرتا ہے تو وہ کام کرتا ہے۔ اگر یہ سستا ہے اور یہ کام کرتا ہے تو یہ بہت بڑی بات ہے۔ لیکن جو کوشش آپ نے اسے تعمیر کرنے میں کی ہے اس کی قیمت کی وضاحت نہیں کی جاسکتی ہے۔ یہ ایک بڑی قیمت کی غلطی ہے ،" ڈننگ نے کہا۔ . "جو قدر کی وضاحت کرتا ہے وہ یہ ہے کہ اس سے کاروبار میں بہتری کیسے آتی ہے۔ اگر منافع میں بہتری آتی ہے یا اخراجات میں کمی آتی ہے یا آپ کی مسابقتی صورتحال کو بہتر بناتا ہے۔ یہ اثر ہے ، کوشش نہیں۔"

7. اسے AI نہ کہو

ڈننگ نے اس بات پر زور دیا کہ ان تکنیکوں کے بارے میں بات کرتے وقت ، کاروبار کو عین مطابق اصطلاحات کا استعمال کرنا چاہئے: ایم ایل ، کمپیوٹر وژن ، یا گہری تعلیم۔ یہ سب کچھ چھتری کی اصطلاح "مصنوعی ذہانت" کے تحت آتا ہے لیکن ، ڈننگ کے مطابق ، AI کی تعریف محض "ایسی چیزیں ہے جو ابھی کام نہیں کرتی ہے۔"

ڈننگ نے کہا ، "میں نے سب سے بہتر تعریف جو میں نے آج تک سنی ہے وہ یہ ہے کہ وہ وہ چیزیں ہیں جن کی ہم ابھی تک وضاحت نہیں کرسکتے ہیں۔ جس چیز کا ہم نے اندازہ نہیں لگایا ہے ،" ڈننگ نے کہا۔ "جب بھی ہم کام کرنے کے لئے کچھ حاصل کرتے ہیں ، لوگ کہتے ہیں 'اوہ ، یہ اے آئی نہیں ہے ، یہ صرف سافٹ ویئر ہے۔ یہ صرف ایک قاعدہ انجن ہے۔ یہ واقعی میں صرف لاجسٹک رجعت ہے۔' اس سے پہلے کہ ہم کسی چیز کا پتہ لگائیں ، ہم اسے AI کہتے ہیں۔ اس کے بعد ، ہم اسے ہمیشہ کچھ اور ہی کہتے ہیں۔ بہت سے طریقوں سے ، AI اگلی محاذ کے لئے بہتر طور پر ایک لفظ کے طور پر استعمال ہوتا ہے ، اور AI میں ، ہمیشہ اگلی محاذ ہوگا۔ جہاں ہم جارہے ہیں ، وہ نہیں جہاں ہم پہلے ہی پہنچ چکے ہیں۔ "

مشین سیکھنے میں کامیابی کے لئے 7 نکات