گھر فارورڈ سوچنا کیوں مشین سیکھنے کا مستقبل ہے

کیوں مشین سیکھنے کا مستقبل ہے

2024

فہرست کا خانہ:

مشین لرننگ مقابلہ

ویڈیو: ‫Ø´Ú©ÛŒÙ„Ø§ Ø§Ù‡Ù†Ú¯ Ø²ÛŒØ¨Ø§ÛŒ ÙØ§Ø±Ø³ÛŒ = ØªØ§Ø¬ÛŒÚ©ÛŒ = Ø¯Ø±ÛŒ = Ù¾Ø§Ø±Ø³ÛŒ‬‎ (اکتوبر 2024)

اس ماہ کی ایس سی 16 سپرکمپوتیننگ کانفرنس میں ، دو رجحانات سامنے آئے۔ سب سے پہلے دنیا کے تیز ترین کمپیوٹرز کی ٹاپ 500 فہرست میں انٹیل کے تازہ ترین ژون فا (نائٹس لینڈنگ) اور نیوڈیا کے تازہ ترین ٹیسلا (پاسکل پر مبنی پی 100) کی نمائش ہے۔ دونوں نظام سرفہرست 20 میں آگئے۔ دوسرا یہ بہت بڑا زور ہے کہ کس طرح چپ اور سسٹم بنانے والے جدید مشین لرننگ سسٹم سے تصورات لے رہے ہیں اور ان کو سپر کمپیوٹر پر لاگو کرتے ہیں۔

ٹاپ 500 کی فہرست کی موجودہ نظر ثانی پر ، جو سالانہ دو بار اپڈیٹ ہوتا ہے ، چارٹ کے اوپری حصے میں ووشی میں چین کے نیشنل سپرکمپٹنگ سینٹر کے سن وے ٹائہ لائٹ کمپیوٹر اور چین کے نیشنل سپر کمپیوٹر سے ٹیانہ 2 کمپیوٹر کے ہاتھ مضبوطی سے ہے۔ گوانگ میں مرکز ، جیسا کہ جون کے آئی ایس سی 16 شو کے بعد سے ہوا ہے۔ تیسرا اور چوتھے درجے کے سسٹم کے ساتھ ، کوئی دوسرا کمپیوٹر کل کارکردگی کے قریب نہیں ، اب بھی اوک رج میں ٹائٹن سپر کمپیوٹر اور لارنس لیورمور میں سیکوئیا سسٹم - دونوں ٹیانھے 2 کی نصف کارکردگی پیش کرتے ہیں۔

ان میں سے پہلا ایک منفرد چینی پروسیسر ، 1.45GHz SW26010 پر مبنی ہے ، جو 64 بٹ RISC کور استعمال کرتا ہے۔ اس میں بے مثال 10،649،600 کور ہیں جن میں لنپیک بنچ مارک پر 15.4 میگا واٹ بجلی استعمال کرتے ہوئے نظریاتی چوٹی تھروپوت کے 125.4 پیٹ فلپس اور 93 پیٹ فلاپس کو زیادہ سے زیادہ ماپا جاتا ہے۔ واضح رہے کہ اگر یہ مشین لنپیک کی کارکردگی میں چارٹ میں بہت بڑے فرق سے سرفہرست ہے ، تو دوسرے ٹیسٹوں میں بھی اس کا زیادہ فائدہ نہیں ہے۔ دیگر کارکردگی جیسے ہائی پرفارمنس کنجوجٹ گریڈینٹ (HPCG) بینچ مارک ، جہاں مشینیں اپنی نظریاتی چوٹی کی کارکردگی کا صرف 1 سے 10 فیصد ہی دیکھتے ہیں ، اور جہاں ٹاپ سسٹم this اس معاملے میں ، Riken K مشین اب بھی کم فراہم کرتی ہے۔ 1 سے زیادہ

لیکن لنپیک ٹیسٹ اعلی کارکردگی والے کمپیوٹنگ (HPC) اور ٹاپ 500 کی فہرست بنانے کے لئے کیا استعمال ہوتا ہے اس کے بارے میں بات کرنے کے معیار ہیں۔ لنپیک ٹیسٹوں کا استعمال کرتے ہوئے ، نمبر 2 مشین ، تیانھے 2 ، پچھلے کچھ سالوں سے چارٹ میں نمبر 1 تھی ، اور اس میں ژیان ای 5 اور پرانی سیون پھی (نائٹس کارنر) ایکسیلیٹر استعمال کیے گئے ہیں۔ اس میں نظریاتی چوٹی کی کارکردگی کے 54.9 پیٹافلپس ، اور لنپیک میں 33.8 پیٹافلپس پر بینچ مارک پیش کیے گئے ہیں۔ بہت سارے مبصرین کا خیال ہے کہ ژیون فا (نائٹس لینڈنگ) کے نئے ورژن کی برآمد پر پابندی کے نتیجے میں چینیوں نے اپنا سپر کمپیوٹر پروسیسر تشکیل دیا۔

نائٹس لینڈنگ ، باضابطہ طور پر ژون پھی 7250 نے ، فہرست میں شامل نئے نظاموں میں ایک بڑا کردار ادا کیا ، لارنس برکلے نیشنل لیبارٹری کے کوری سپر کمپیوٹر سے پانچویں نمبر پر آرہا ہے ، جس کی چوٹی کارکردگی 27.8 پیٹافلوپس کی ہے اور 14 پیٹ فلپس کی ماپا کارکردگی . میش انٹرکنیکٹ کا استعمال کرتے ہوئے ، یہ ایک کری XC40 سسٹم ہے۔ نوٹ کریں کہ نائٹس لینڈنگ ایک مرکزی پروسیسر کی حیثیت سے کام کرسکتی ہیں ، 68 کور فی پروسیسر کے ساتھ 3 چوٹی teraflops کی فراہمی ہے۔ (انٹیل اپنی قیمت کی فہرست میں چوٹی نظریاتی ڈبل صحت سے متعلق کارکردگی کے 46.4646 ٹیرافلوپس پر c 72 کور کے ساتھ چپ کا ایک اور ورژن درج کرتا ہے ، لیکن فہرست میں شامل کوئی بھی مشینیں اس ورژن کو استعمال نہیں کرتی ہے ، شاید اس لئے کہ یہ زیادہ عمدہ ہے اور زیادہ توانائی استعمال کرتی ہے۔)

اس سے قبل ژیون فیس صرف سسٹم میں ہی ایکسیلیٹر کے طور پر چل سکتی تھیں جنہیں روایتی ژیون پروسیسروں کے ذریعہ کنٹرول کیا جاتا تھا۔ چھٹے مقام پر جاپان کے مشترکہ مرکز برائے اعلی درجے کی اعلی کارکردگی والے کمپیوٹر کا اوک فورسٹ پی اے سی ایس نظام تھا ، جس نے 24.9 چوٹی کے پیٹ فلاپس اسکور کیے۔ یہ فوجیتسو نے نائٹس لینڈنگ اور انٹیل کے اومنی-راہ باہمی ربط کا استعمال کرتے ہوئے بنایا ہے۔ نائٹ لینڈنگ کا استعمال نمبر 12 کے نظام میں (اٹلی کے CINECA میں مارکونی کمپیوٹر ، لینووو نے بنایا تھا اور اومنی-راہ کا استعمال کرتے ہوئے) اور نمبر 33 سسٹم (جاپان کی کیوٹو یونیورسٹی میں کیمفر 2 ، کری نے بنایا تھا اور میشوں کا استعمال کرتے ہوئے) باہم رابطہ)۔

نئی فہرست میں بھی نویڈیا کی اچھی نمائندگی تھی۔ نمبر 8 کے سسٹم ، سوئس قومی سپرکمپوتنگ سینٹر میں پیز ڈینٹ ، کو زینز اور نویڈیا ٹیسلا پی 100 کے ساتھ کری XC50 میں اپ گریڈ کیا گیا ، اور اب وہ نظریاتی چوٹی پرفارمنس کے صرف 16 پیٹ فلپس ، اور لنپیک کارکردگی کے 9.8 پیٹ فلپس پیش کرتا ہے۔ Nvidia K20x ایکسلریٹر کے ساتھ کری XC30 پر مبنی اس کے ابتدائی تکرار میں چوٹی کی کارکردگی کے 7.8 پیٹ فلپس اور لنپیک کارکردگی کے 6.3 پیٹ فلپس سے اپ گریڈ کریں۔

اس فہرست میں شامل دوسرا P100 پر مبنی نظام ، Nvidia کا اپنا ڈی جی ایکس Saturn V تھا ، جس کی بنیاد کمپنی کے اپنے DGX-1 سسٹمز اور انفینی بینڈ انٹرکنیکٹ ہے ، جو فہرست میں نمبر 28 پر آیا تھا۔ نوٹ کریں کہ اب نویڈیا پروسیسرز اور ڈی جی ایکس 1 ون آلات دونوں کو فروخت کررہی ہیں ، جس میں سافٹ ویئر اور آٹھ ٹیسلا پی 100 شامل ہیں۔ ڈی جی ایکس سٹرنی وی سسٹم ، جسے اینویڈیا اندرونی اے آئی کی تحقیق کے لئے استعمال کرتا ہے ، اس کا سکور تقریبا 4. 4.9 پیٹ پیٹ فلپس اور 3.3 لنپیک پیٹافلوپس ہے۔ لیکن نیوڈیا نے جس بات کی نشاندہی کی ہے وہ یہ ہے کہ وہ صرف 350 کلو واٹ بجلی استعمال کرتی ہے ، جس سے اس سے کہیں زیادہ توانائی موثر ہوتی ہے۔ اس کے نتیجے میں ، یہ نظام سب سے زیادہ توانائی سے چلنے والے نظام کی گرین 500 کی فہرست میں سرفہرست ہے۔ نیوڈیا نے بتایا کہ یہ زیون پھی پر مبنی کیمپور 2 سسٹم کے مقابلے میں کافی کم توانائی ہے ، جس کی کارکردگی اسی طرح کی ہے (تقریبا.5 5.5 پیٹافلوپس چوٹی اور 3.1 لنپیک پیٹ فلاپس)۔

یہ ایک دلچسپ موازنہ ہے ، جس میں Nvidia GPUs پر بہتر توانائی کی کارکردگی کا پتہ لگارہی ہے اور انٹیل ایک زیادہ واقف پروگرامنگ ماڈل کو تلاش کررہی ہے۔ مجھے یقین ہے کہ ہم آنے والے سالوں میں مزید مقابلہ دیکھیں گے ، کیوں کہ مختلف فن تعمیر یہ دیکھنے کے لئے مقابلہ کرتے ہیں کہ ان میں سے کون "خارجی کمپیوٹنگ" تک پہونچنے میں پہلا ہوگا یا اس کی بجائے وہاں چینی گھریلو انداز حاصل ہوگا۔ فی الحال ، امریکی محکمہ برائے توانائی کے ایکساسیکل کمپیوٹنگ پروجیکٹ کی توقع ہے کہ 2022 میں پہلی خارجی مشینیں لگائی جائیں گی اور اگلے سال رواں دواں ہوں گی۔

مجھے یہ دیکھنا دلچسپ ہے کہ Nvidia Tesla اور Intel Xeon Phi حل جیسے بہت سے بنیادی ایکسیلیٹرز پر زور دینے کے باوجود ، صرف 96 سسٹم ایسے ہی ایکسیلیٹر استعمال کرتے ہیں (جن میں وہ بھی شامل ہیں جو اکیلا پھی استعمال کرتے ہیں)۔ جیسا کہ ایک سال پہلے 104 نظاموں کی مخالفت کی گئی تھی۔ انٹیل اب بھی سب سے بڑا چپ فراہم کرنے والا ہے ، اس کے چپس کے ساتھ اوپر 500 سسٹموں میں سے 462 میں ، اس کے بعد 22 میں آئی بی ایم پاور پروسیسرز ہیں۔ ہیولٹ پیکارڈ انٹرپرائز نے 140 سسٹم بنائے (بشمول سلیکن گرافکس کے ذریعے تعمیر کردہ ، جس میں ایچ پی ای نے حاصل کیا) ، لینووو نے تعمیر کیا 92 ، اور کرے 56۔

مشین لرننگ مقابلہ

شو میں یا اس کے آس پاس متعدد اعلانات ہوئے ، جن میں زیادہ تر مصنوعی ذہانت یا مشین سیکھنے کی کچھ شکلیں تھیں۔ این ویڈیا نے آئی بی ایم پاور ای اے کے نام سے ایک نئے گہری سیکھنے والے سافٹ ویئر ٹول کٹ پر آئی بی ایم کے ساتھ شراکت کا اعلان کیا جو Nvidia کے NVLink انٹرکنیکٹ کا استعمال کرتے ہوئے IBM پاور سرور چلاتا ہے۔

اے ایم ڈی ، جو HPC اور مشین لرننگ دونوں ماحولوں میں سوچ رہی ہے ، اس کو تبدیل کرنے کے لئے کام کر رہی ہے۔ اس علاقے میں ، کمپنی نے اپنے ہی Radeon GPUs پر توجہ دی ، اپنے فائر پرو S9300 x2 سرور GPUs کو آگے بڑھایا ، اور گوگل کلاؤڈ پلیٹ فارم کے ساتھ شراکت کا اعلان کیا تاکہ اس کو بادل کے اوپر استعمال کیا جا سکے۔ لیکن AMD نے پروگرامنگ GPUs کے لئے سافٹ ویئر میں اتنی زیادہ سرمایہ کاری نہیں کی ہے ، کیونکہ یہ Nvidia کے زیادہ ملکیتی نقطہ نظر پر اوپن سی ایل پر زور دے رہا ہے۔ شو میں ، اے ایم ڈی نے اپنے ریڈون اوپن کمپیوٹ پلیٹ فارم (آر او سی ایم) کا ایک نیا ورژن متعارف کرایا ، اور متعدد سی پی یوز کے ساتھ متعدد سی پی یوز کے ساتھ اس کے جی پی یوز کی حمایت کرنے کے منصوبوں پر زور دیا ، جس میں اس کے آنے والے "زین" x86 سی پی یوز ، اے آر ایم آرکیٹیکچرز کاویئم کے تھنڈر ایکس سے شروع ہوتے ہیں۔ آئی بی ایم پاور 8 سی پی یوز۔

شو میں ، انٹیل نے اپنے موجودہ Xeon E5v4 (براڈویل) چپ کے فلوٹنگ پوائنٹ ورک بوجھ کے لئے بنائے گئے چپ کے ایک نئے ورژن کے بارے میں بات کی ، اور اسکایلیک پلیٹ فارم پر مبنی اگلا ورژن اگلے سال کیسا ہے۔ لیکن اس ہفتے کے بعد کے ایک واقعہ میں ، انٹیل نے اعلانات کا ایک سلسلہ تیار کیا جو مصنوعی ذہانت یا مشین سیکھنے کی جگہ میں اپنے چپس کو پوزیشن کے ل. تیار کیا گیا تھا۔ (یہاں ایکسٹریم ٹیک کی بات ہے۔) اس میں زیادہ تر اعلی کارکردگی والے کمپیوٹنگ کے مضمرات ہیں ، لیکن زیادہ تر الگ ہیں۔ شروع کرنے کے لئے ، معیاری زیون پروسیسرز کے علاوہ ، کمپنی عصبی نیٹ ورکس میں زیادہ تر مداخلت کرنے پر ایف پی جی اے کو بھی فروغ دے رہی ہے۔ یہی ایک بڑی وجہ ہے کہ کمپنی نے حال ہی میں الٹیرا خریدا تھا ، اور اب اس طرح کے ایف پی جی اے مائیکروسافٹ جیسی کمپنیاں استعمال کرتی ہیں۔

لیکن پچھلے ہفتے اے آئی پر توجہ دینے سے کچھ نئے چپس نمٹائے گئے۔ پہلے ، وہاں ژیون پھی ہے ، جہاں انٹیل نے اشارہ کیا ہے کہ موجودہ نائٹس لینڈنگ کے ورژن کو اگلے سال نائٹس مل کے نام سے ایک نئے ورژن کے ساتھ پورا کیا جائے گا ، جس کا مقصد "گہری سیکھنے" مارکیٹ ہے۔ آئی ڈی ایف میں اعلان کیا گیا ، یہ ایک اور 14nm ورژن ہے لیکن نصف صحت سے متعلق حساب کے لئے اعانت کے ساتھ ، جو اعصابی نیٹ ورک کی تربیت میں اکثر استعمال ہوتا ہے۔ در حقیقت ، گہری سیکھنے میں موجودہ نیوڈیا چپس کا ایک بہت بڑا فائدہ نصف صحت سے متعلق حساب اور 8 بٹ عدد عدد کارروائیوں کے لئے ان کی حمایت ہے ، جس کی نویدیا اکثر گہری سیکھنے کو کہتے ہیں "ٹیرا اوپس"۔ انٹیل نے کہا ہے کہ نائٹس مل گہری سیکھنے کے لئے نائٹس لینڈنگ کی کارکردگی کو چار گنا تک فراہم کرے گی۔ (اس چپ کا بعد میں نائٹ ہل نامی ایک 10nm ورژن ہوگا جس کا مقصد روایتی اعلی کارکردگی والے کمپیوٹنگ مارکیٹ کا زیادہ مقصد ہے۔)

اگلے سال کے لئے سب سے زیادہ دلچسپ ، نروانا کا ایک ڈیزائن ہے ، جو انٹیل نے حال ہی میں حاصل کیا ہے ، جس میں اعلی بینڈوتھ میموری (HBM) سے منسلک سادہ ریاضی کے آپریشن کرنے کے لئے ڈیزائن کردہ پروسیسنگ کلسٹرز کا ایک صف استعمال ہوتا ہے۔ اس خاندان میں سب سے پہلے لیک کرسٹ ہوگا ، جو انٹیل نے کمپنی خریدنے اور 28nm TSMC پروسیس پر تیار کرنے سے پہلے ڈیزائن کیا تھا۔ اگلے سال کی پہلی ششماہی میں ٹیسٹ ورژنوں کی وجہ سے ، انٹیل کا کہنا ہے کہ یہ ایک جی پی یو سے زیادہ خام کمپیوٹ کارکردگی پیش کرے گا۔ آخر کار اس کے بعد نائٹس کرسٹ ہوگا ، جو کسی حد تک زیوون کے ساتھ ساتھ نروانا کی ٹکنالوجی کو نافذ کرتا ہے ، جس کی تفصیلات ابھی تک غیر اعلانیہ ہیں۔

انٹیل کے سی ای او برائن کرزانیچ نے لکھا ، "ہم توقع کرتے ہیں کہ نروانا کی ٹیکنالوجیز آئندہ تین سالوں میں پیچیدہ عصبی نیٹ ورکس کی تربیت کے ل performance کارکردگی میں 100 گنا اضافہ کریں گی ، جس سے ڈیٹا سائنسدانوں کو ان کے سب سے بڑے اے آئی چیلنجوں کو تیزی سے حل کرنے میں مدد ملے گی۔"

انٹیل نے حال ہی میں موویڈیوس کے حصول کے منصوبوں کا بھی اعلان کیا ہے ، جو ڈی ایس پی پر مبنی چپس کو خاص طور پر کمپیوٹر وژن انفرنسننگ کے لئے موزوں بنا دیتا ہے ، جو پہلے تربیت یافتہ ماڈلز پر مبنی فیصلے کرتے ہیں۔

یہ ایک پیچیدہ اور ابھرتی ہوئی کہانی ہے۔ یقینی طور پر اتنی سیدھی نہیں جتنی کہ Nvidia کے اپنے GPUs کے لئے ہر طرف دباؤ ڈالتی ہے۔ لیکن جو بات یہ واضح کرتی ہے وہ ہے کہ مشین سیکھنے کا عمل کتنی جلدی شروع ہورہا ہے ، اور بہت سے مختلف طریقوں سے کہ کمپنیاں Nvidia اور AMD جیسے GPUs سے ، Xeon Phi جیسے بہت سے کور x86 پروسیسرز ، FPGAs تک ، اس مسئلے کو دور کرنے کا منصوبہ بنا رہی ہیں۔ ، نروانا اور آئی بی ایم کی ٹرو نارتھ جیسے ٹریننگ کے ل specialized خصوصی مصنوعات کو ، جیسے گوگل کی ٹینسر پروسیسنگ یونٹ جیسے کسٹم ڈی ایس پی نما انفرنسننگ انجن۔ یہ دیکھنا بہت دلچسپ ہوگا کہ آیا مارکیٹ میں ان تمام طریقوں کی گنجائش ہے یا نہیں۔