گھر فارورڈ سوچنا گرم چپس: مشین لرننگ سنٹر مرحلے میں لی جاتی ہے

گرم چپس: مشین لرننگ سنٹر مرحلے میں لی جاتی ہے

ویڈیو: من زينو نهار اليوم ØµØ Ø¹ÙŠØ¯ÙƒÙ… انشر الفيديو Øتى يراه كل Ø§Ù„Ø (اکتوبر 2024)

ویڈیو: من زينو نهار اليوم ØµØ Ø¹ÙŠØ¯ÙƒÙ… انشر الفيديو Øتى يراه كل Ø§Ù„Ø (اکتوبر 2024)
Anonim

ان دنوں کمپیوٹنگ میں سب سے گرما گرم موضوع مشین لرننگ ہے ، اور یہ یقینی طور پر ہارڈ ویئر کے پہلو پر نظر آتا ہے۔ حالیہ ہفتوں میں ، ہم نے نیوڈیا کے ٹیسلا پی 100 اور ڈرائیو پی ایکس 2 سے لے کر انٹیل کے ژیون پھی تک گوگل کے ٹینسر پروسیسنگ یونٹوں تک ، گہری سیکھنے کے لئے ڈیزائن کردہ نئی چپس کے بارے میں بہت کچھ سنا ہے۔ لہذا ، یہ حیرت کی بات نہیں ہے کہ گذشتہ ہفتے ہاٹ چپس کانفرنس میں ہم نے مشین سیکھنے اور وژن پروسیسنگ کے مطابق ڈیزائن کرنے کے لئے کچھ بہت مختلف نقطہ نظر والی متعدد مختلف کمپنیوں سے سنا۔

شاید سب سے بڑی خبر Nvidia نے اپنے پارکر چپ پر مزید تفصیل سے انکشاف کیا تھا ، جو خود ڈرائیونگ کاروں کے لئے اس کے ڈرائیو PX 2 ماڈیول میں استعمال کیا گیا تھا اور اس کا مقصد خود مختار مشینوں کی گہری تعلیم حاصل کرنا تھا۔ اس چپ میں دو کسٹم بلٹ اے آر ایم سے ہم آہنگ ڈینور سی پی یو کور ، چار اے آر ایم کارٹیکس- A57 کور ، اور 256 جو Nvidia پاسکل CUDA (گرافکس) کور کی اصطلاح سے تعبیر کرتی ہیں۔

نیوڈیا نے کہا کہ یہ پہلو چپ ہے جو آٹوموٹو استعمال کے لئے ڈیزائن کیا گیا اور اس کی درجہ بندی کی گئی ہے ، خصوصی لچکدار خصوصیات کے ساتھ ، اور اس کی تیز رفتار اور یادداشت پر بات کی ، انہوں نے بتایا کہ ڈینور کور فی واٹ کی کارکردگی میں نمایاں بہتری لاتا ہے۔ نئی خصوصیات میں ہارڈ ویئر سے مدد والی ورچوئلائزیشن بھی شامل ہے ، 8 کاروں تک VMS تک کار کی خصوصیات کے انضمام کو اہل بنانا ہے جو روایتی طور پر الگ الگ کمپیوٹرز پر کی جاتی ہیں۔ مجموعی طور پر ، کمپنی نے کہا کہ ڈرائیو پی ایکس 2 ماڈل میں ان میں سے دو پارکر چپس اور دو مجرد جی پی یو ہوسکتے ہیں ، جن کی کل کارکردگی 8 ٹیرافلوپس (ڈبل صحت سے متعلق) یا 24 گہری سیکھنے کی کارروائی (8 بٹ ، یا آدھا صحت سے متعلق ہے۔) نسبتا old قدیم بنچ مارک کمپنی ، اسپیشینٹ 3000 کا استعمال کرتے ہوئے موجودہ موبائل پروسیسنگ کے ساتھ سازگار طریقے سے اس کا موازنہ کرنے والی کمپنیوں میں شامل ہیں۔ لیکن کارکردگی متاثر کن دکھائی دیتی ہے ، اور ولولو نے حال ہی میں کہا ہے کہ وہ اسے اگلے سال سے شروع ہونے والی خودمختار گاڑیوں کی جانچ کے لئے استعمال کرے گا۔

بے شک ، بہت سارے اور طریقے ہیں۔

چینی اسٹارٹاپ ڈیفھی نے عصبی نیٹ ورکس کے لئے ایف پی جی اے پر مبنی پلیٹ فارم پر تبادلہ خیال کیا ، جس میں نیٹ ورک کی نوعیت پر منحصر دو مختلف فن تعمیر ہیں۔ ارسطو نسبتا small چھوٹے چھوٹے مجازی عصبی نیٹ ورکس کے لئے ڈیزائن کیا گیا ہے اور زیلینکس زینک 7000 پر مبنی ہے ، جبکہ ڈسکارٹس طویل المیعاد میموری (RNN-LSTM) کا استعمال کرتے ہوئے بڑے بار بار چلنے والے اعصابی نیٹ ورکس کے لئے ڈیزائن کیا گیا ہے ، کائنٹیکس الٹرا اسکیل ایف پی جی اے کی بنیاد پر۔ ڈیفی کا دعوی ہے کہ اس کے مرتب اور فن تعمیر نے ترقیاتی وقت کو ایف پی جی اے کے بیشتر استعمال کے مقابلے میں کم کیا ہے اور یہ بھی کہ ایف پی جی اے کا استعمال نیوڈیا کے ٹیگرا کے ون اور کے 40 کے حلوں سے بہتر کارکردگی فراہم کرسکتا ہے۔

دوسرا نقطہ نظر یہ ہے کہ ڈیجیٹل سگنل پروسیسر یا ڈی ایس پی کا استعمال کریں ، جو عام طور پر بہت کم توانائی استعمال کرتے ہوئے ایک خاص فنکشن یا فنکشن کا ایک چھوٹا سیٹ انجام دیتے ہیں۔ وژن پروسیسنگ جیسے خاص کاموں کو تیز کرنے کے ل Often اکثر یہ دوسرے ، زیادہ پیچیدہ چپس میں سرایت کرتے ہیں۔ ہاٹ چپس میں متعدد کمپنیاں ، جن میں موویڈیوس ، سی ای وی اے ، اور کیڈینس شامل ہیں ، اپنے حل بانٹ رہے تھے۔

موویڈیوس اپنا ڈی ایس پی پر مبنی حل دکھا رہا تھا جسے ہزارہا 2 وژن پروسیسنگ یونٹ کے نام سے جانا جاتا ہے ، اور اسے ڈی جے آئی فینٹم 4 ڈرون میں ڈسپلے پر لایا گیا تھا۔ اس نے یہ بھی ظاہر کیا کہ 2014 کے امیجنیٹ مقابلہ میں ہزارہا 2 ، جی پی یوز اور گوگل لیٹ گہرے نیورل نیٹ ورک کو کس طرح بہتر کارکردگی کا مظاہرہ کرتا ہے۔

CEVA اپنے CEVA-XM4 وژن ڈی ایس پی کو فروغ دے رہا تھا ، خاص طور پر وژن پروسیسنگ کے لئے بنایا گیا تھا اور اس کا مقصد آٹوموٹو مارکیٹ کے ساتھ ساتھ اس کے سی ای وی ڈیپ نیورل نیٹ ورک 2 پلیٹ فارم کے ساتھ تھا ، جس نے کہا تھا کہ کیفے یا ٹینسرفلو فریم ورک کے لئے لکھا ہوا کچھ بھی لے سکتا ہے اور اسے چلانے کے ل optim بہتر بناتا ہے۔ اس کے ڈی ایس پی پر نیا پروسیسر اگلے سال ایس او سی میں ہونا چاہئے۔

دریں اثنا ، کیڈینس ، جو ٹینسیلیکا خاندان کو وژن پروسیسرز (جس کو دیگر مصنوعات میں شامل کیا جاسکتا ہے) بناتا ہے ، نے اپنے جدید ترین ورژن ، ویژن پی 6 پر تبادلہ خیال کیا ، جس میں نئی ​​خصوصیات شامل کی گئی ہے جیسے ویکٹر فلوٹنگ پوائنٹ سپورٹ اور دیگر خصوصیات بشمول عصبی اعصابی نیٹ ورک کے ل added . پہلی مصنوعات جلد ہی باہر ہوجائیں۔

مائیکرو سافٹ نے اپنے ہولو لینس ہیڈسیٹ کے لئے ہارڈ ویئر کی تفصیلات کے بارے میں بات کرتے ہوئے کہا کہ اس نے ونڈوز 10 چلانے والے 14nm انٹیل ایٹم چیری ٹریل پروسیسر اور ایک کسٹم ہولوگرافک پروسیسنگ یونٹ (HPU 1.0) سینسر ہب استعمال کیا ہے ، جسے TSMC نے 28nm عمل میں تیار کیا ہے۔ اس میں 24 ٹینسیلیکا ڈی ایس پی کور شامل ہیں۔

مجھے خاص طور پر کیڈینس کی ایک سلائیڈ نے لے لیا تھا جس میں جی پی یو ، ایف پی جی اے ، اور مختلف قسم کے ڈی ایس پیز کے ٹرانس پٹ اور کارکردگی میں فرق ظاہر ہوا تھا جو اعصابی نیٹ ورکس کے لئے اہم عمارتوں میں سے ایک ہے۔ اگرچہ واضح طور پر خود خدمت کرنے والے (جیسا کہ سب وینڈرز کی پیش کش ہیں) ، اس نے اس بات کی نشاندہی کی کہ رفتار اور کارکردگی (فی واٹ کارکردگی) کے لحاظ سے مختلف تکنیکیں کس طرح مختلف ہوتی ہیں ، لاگت اور پروگرامنگ میں آسانی کا ذکر نہیں کرنا۔ یہاں مختلف نقطaches نظر کے بہت سارے حل موجود ہیں ، اور یہ دیکھنا دلچسپ ہوگا کہ آئندہ چند سالوں میں یہ کس طرح سے ہلتا ​​ہے۔

گرم چپس: مشین لرننگ سنٹر مرحلے میں لی جاتی ہے