
05-20-2013
|
 |
مدیر بخش مکانیک - ویندوز و رفع اشکال  
|
|
تاریخ عضویت: Sep 2009
نوشته ها: 2,586
سپاسها: : 5,427
6,159 سپاس در 1,794 نوشته ایشان در یکماه اخیر
|
|
بررسی کارت گرافیک NVIDIA GFORCE GIGABYTE GTX 580
GIGABYTE GTX 580
GIGABYTE GTX 580
GTX 580
حرکت انویدیا و ATI برای انتشار همزمان کارتهای گرافیکی جدید در پاییز کمی عجیب بود. تا پیش از این معمولا فاصله زمانی مناسبی برای عدم تداخل در معرفی محصولات در نظر گرفته میشد اما این رویکرد جدید نشان میدهد رقابت در دنیای کارتهای گرافیکی به روزهای اوج خود نزدیک میشود. رقابتی که حالا نه تنها کارایی کارتها را هدف قرار گرفته که به شدت تحت تاثیر بازیهای سازگار با رابط دایرکتایکس ۱۱ و همچنین قیمت تمام شده محصول است. شاید به همین دلیل هر دو تولید کننده ترجیح دادند از سهم بازار بیشتری در غیاب رقیب برخوردار شوند و کاملا مشخص است که هر دو به این سهم بازار چقدر احتیاج دارند.
اکنون ماجرای حضور GTX 580 بعد از تجربه ناموفق سری GTX 480 برای انویدیا حیثیتی است و میتواند آینده این شرکت را تحت تاثیر قرار دهد. اما به نظر میرسد تراشه جدید این شرکت اگرچه هنوز در بحث گرما و مصرف انرژی با انتقادهایی روبرو است اما از نظر کارایی میتواند همچنان از عنوان بهترین تراشه گرافیکی دفاع کند. این شرکت مدعی است کارایی نسل جدید تراشههای گرافیکی بالاتر از نسل GTX480 است و اگرچه معماری هسته هیچ تغییری نداشته اما تراشههای جدید فرمی (Fermi) در سری GF110 که با همان فناوری ساخت ۴۰ نانومتری تولید میشوند میتوانند راندمان بهتری را نشان دهند. GF110 دو تفاوت اصلی با GF100 دارد که شامل پالایش و پرداخت تصاویر بافتهای ***** FP16 با سرعت کامل و افزایش بازده پردازش Z-Cull میشود. تراشههای جدید انویدیا میتوانند *****ینگ بافتی FP16 را با سرعتی بیشتری انجام دهند و این توانایی زمانی که سرعت پردازش بافتی محدود شده باشد میتواند سرعت پردازش را افزایش دهد. پردازش Z-Cull هم باعث ارتقا پهنای باند حافظه گرافیکی میشود.
قبل از توضیحات بیشتر در مورد GTX 580 بهتر است با ساختار فرمی بیشتر آشنا شوید. این توضیحات را باید در کنار تصویر معماری تراشه بخوانید تا به خوبی نوع مهندسی تراشههای فرمی را متوجه شوید. این تراشهها دارای ۵۱۲ پردازنده جریانی (Stream Processors) هستند. البته انویدیا نام این پردازندهها را هستههای کودا (CUDA) گذاشته است. هستههای کودا در بلوکهایی ۳۲ عددی جای میگیرند که به آنها SM گفته میشود و چهار گروه از این SMها در یک خوشه پردازشی (کلاستر) ردیف میشوند. به این خوشه GPC گفته میشود. در نهایت چهار GPC یک تراشه با معماری GF100 را تشکیل میدهند. در طراحی این پردازنده گرافیکی میتوانید این چهار واحد را ببینید که دو واحد در بالا و دو واحد نیز در پایین تراشه قرار گرفتهاند و بین آنها را حافظه درونی L2 پر کرده است. این حافظه به صورت ۴۸ واحد در میان تراشه قرار گرفته و ردهبندی آنها به صورت شش بخش است که در هر کدام از آنها هشت حافظه استفاده شده است. در اطراف تراشه نیز شش واحد کنترل حافظه دیده میشوند.
16 واحد SM در میان چهار واحد GPC مشخص هستند. این SMها میتوانند در هر چرخه فرکانس ۵۱۲ دستورالعمل را اجرا کنند. در انتهای ساختار SM چهار واحد پردازش بافتی نیز قرار داده شده و علاوه بر آن در هر SM یک واحد پردازش هندسی نیز وجود دارد که مجموع آنها به ۱۶ واحد میرسد. انویدیا نام این قسمت را موتور پلیمورف یا موتور چندشکلی گذاشته است. موتورPolyMorph و موتور پیکسلی Raster دو بخش مهم اجرایی در ساختار فرمی هستند که در واقع یکی از تفاوتهای مهم این کارتها با نسلهای پیشین ناشی از این دو قسمت است. موتور Raster ترکیبی از تمام روشهای پیشین برای پردازش تصویر است که شامل تنظیم لبهها و سهضلعیها، تبدیل تصاویر به بیتمپ یا نقشههای بیتی و تبدیل نقشههای دوبعدی به تصاویر سه بعدی است. این واحد در تراشههایی که دارای معماری GF100 هستند میتواند در هر چرخه فرکانس تا ۳۲ پیکسل را پردازش کند. موتور پلیمورف که انویدیا آن را برای پردازشهای هندسی اختصاص داده است، چندین فعالیت اصلی را در کارتهای گرافیکی انجام میدهد که موارد زیر از نمونههای این وظایف است:
Vertex Fetch: در تصاویری مثل سطح آب یا آتش با وجود اینکه با یک بافت سطحی روبهرو هستیم اما این بافت ثابت نیست و حرکت دارد. به عنوان مثال امواج بسیار کوچک سطح آب یا زبانههای شعله آتش اگر به صورت بافت پردازش شوند نتیجه یک تصویر صاف و بدون جزییات خواهد بود. موتور پلیمورف پردازش این سطوح را انجام میدهد که تاثیر زیادی در کیفیت تصویر دارد.
Tessellation: تصاویر سه بعدی از چندضلعیها تشکیل شدهاند و با کمک Tessellation یا موزاییککاری، این چندضلعیها در یک ساختار مناسب کنار هم قرار میگیرند و آماده پردازش میشوند. دلیل این امر هم پیچیدگیهایی است که برای پردازش مستقیم تصویر وجود دارد و کارتهای گرافیکی با تقسیم یک سطح به چندضلعیها کار پردازش را آسانتر میکنند. با این حال جزییات ظریفی که در برخی اجسام مانند صورت انسان وجود دارد نیاز به توان قابلتوجهی از سوی کارت گرافیکی دارد. علت اینکه نام این بخش Tessellation یا موزاییککاری گذاشته به دلیل شیوه مشابهی است که در پرداخت گرافیکی انجام میشود و این چند ضلعیها بطور مرتب در کنار یکدیگر قرار میگیرند تا تصویر نهایی تشکیل شود.
Viewport Transform: تصاویر در بازیها و نمایشهای سهبعدی همیشه تولید نمیشوند و اغلب از تصاویر از پیش طراحی شده برای نمای سهبعدی استفاده میشود که این شبهعکسها با قرار گرفتن در کنار یکدیگر تصویر نهایی را خلق میکنند. در پردازشهای گرافیکی موضوع جایگیری و چیدمان این تصاویر مهم است و این بخش توسط Viewport مدیریت میشود.
موتورهای Raster در یک تراشه با مهندسی GF110 چهار عدد هستند یعنی برای هر GPC یک موتور Raster در نظر گرفته شده در حالیکه موتورهای پلیمورف در هر GPC چهار عدد هستند و مجموع آنها در یک تراشه به ۱۶ عدد میرسد. ضمنا باید توجه داشت که بسیاری از این امکانات برای این تراشه یا این کارتهای گرافیکی انحصاری نیست بلکه مجموعهای از تواناییهای فراهم شده توسط نسخه یازدهم دایرکتایکس است که کارتهای مختلف توان متفاوتی در اجرای آنها دارند. قبلا در تراشههای نسل GT200 از یک موتور Raster بزرگ استفاده میشد. به کارگیری ۱۶ موتور پلیمورف به این معنی است که امکان پردازش موازی در این حالت بیشتر است و البته باید توجه داشت مدیریت این دادهها به صورت موازی که در کانال اطلاعات قرار دارند کار آسانی نیست. GF110 علاوه براین موارد، تکههای مختلف و اجزای کوچک تصویر را نیز بررسی میکند و در صورت لزوم آنها را به تکههای کوچکتر تبدیل خواهد کرد تا توسط چند SM به صورت همزمان پردازش شوند. در این حالت اطلاعات مرتبط با داده در حال پردازش درون هستهباقی میماند و از طریق حافظه سطح L1 در میان SMها جابهجا میشوند.
GTX 580
طراحی اصلی مهندسی فرمی از ۱۶ واحد پردازشی موسوم به Streaming Multiprocessors بهره میبرد. هر کدام از این واحدهای پردازشی، شامل ۳۲ هسته کودا، چهار واحد پردازش بافتی و یک موتور پردازشی PolyMorph است. در جیفورس GTX 480 پانزده واحد پردازشی SM فعال هستند که در نتیجه آن ۴۸۰ پردازنده کودا و ۶۰ واحد پردازش بافتی در اختیار تراشه قرار دارد. در جیفورس GTX 580 تمام ۱۶ واحد پردازشی SM فعال بوده که ۳۲ هسته کودا و چهار واحد پردازشی بافتی در کنار یک موتور پردازشی PolyMorph را به ۱۵ واحد موجود در GTX 480 اضافه میکند و ساختار GTX 580 را تشکیل میدهد.
در طراحی مدارهای تغذیه کارتهای GTX 580 دقت بیشتری صورت گرفته تا جایی که این کارتها نظارت بیشتری روی مصرف توان و دمای کارت دارند. یکی از این شیوههای نظارتی استفاده از دو تراشه کوچک در پشت کارت است که با افزایش توان مصرفی کارت در مقادیر بالای ۳۰۰ وات که در نتیجه پردازشهای سنگین سهبعدی باشد میزان فرکانس تراشه کاهش پیدا میکند. البته انویدیا اعلام کرده است که از این روش صرفا برای برنامههایی که روی کارت استرس غیرواقعی وارد میکنند استفاده خواهد کرد و در حال حاضر برنامههایی مثل Furmark و OCCT در میان این نرمافزارها طبقهبندی شدهاند. این اعلام انویدیا به دنبال انتقادهایی بود که اورکلاکرها و گیمرها در مقابل GTX 580 مطرح کردند. با این حال علیرغم این انتقادها انویدیا هرگونه تاثیر روی بازیها را تکذیب کرده است و حتی در تنها موردی که برای بازی استارکرافت ۲ پیش آمده بود اعلام کرد خطای موتور پردازشی این بازی عامل اصلی اختلال در محیط منوها و برخی قسمتهای بازی بوده است.
حافظههای GTX 580 مشابه همان حافظههای GTX 480 هستند. حجم حافظه نیز با توجه به حداکثر پهنای باند رابط حافظه ممکن یعنی ۳۸۴ بیت، از ۵/۱ گیگابایت تغییری نکرده است. رابط ۳۸۴ بیتی در کنار حافظههای GDDR5 میتواند پهنای باند بالایی را در اختیار کارت قرار دهد که در مورد این کارت میتوان از طریق برنامه GPU-Z مقدار ۱۹۲ گیگابایت در ثانیه را مشاهده کرد. در مورد مصرف توان و مقایسه آن با GTX 480 باید گفت با فعال کردن واحد پردازشی شانزدهم، مصرف انرژی و تولید گرما در تراشه GF110 افزایش مییابد. به این معنی که تعداد واحدهای پردازشی در نسل قبلی پانزده عدد بود که اکنون به ۱۶ واحد رسیده است. انویدیا برای حل این مشکل، تغییراتی را در ساختار این تراشه نسبت به تراشههای قبلی ایجاد کرده و سعی کرده از ترانزیستورهایی با بازده مصرف انرژی بالاتر استفاده کند.
انویدیا با تغییراتی کلی در ساختار تراشه GF100، ترانزیستورهای کندتر و با نشتی جریان کمتر را به قسمتهایی که به زمان پاسخگویی حساسیت کمتری دارند انتقال داده و ترانزیستورهای با نشتی جریان بالا را به سایر قسمتهای چیپ انتقال داده است. نتیجه اینکه جیفورس GTX 580، با وجود تعداد واحدهای پردازشی بیشتر و توان محاسباتی بالاتر، مصرف انرژی کمتری نسبت به GTX 480 دارد که یک قدم مثبت و قابل تحسین به حساب میآید.
سیستم خنککننده
جیفورس GTX 580 از یک سیستم خنککننده جدید و متفاوت از آنچه در جیفورس GTX 480 دیدهایم، بهره میبرد. در طراحی این سیستم خنککننده به جای لولههای حرارتی، از یک مخزن بخار استفاده میشود که سیکل تبخیر و میعان در آن صورت میگیرد. این مخزن بخار، گرما را بخش پرهها رسانده است، ضمن اینکه یک فن دمنده نیز، این گرما را به سمت انتهای کارت و خارج از کیس هدایت میکند. این سیستم خنککننده در عمل بسیار خوب ظاهر شده به طوریکه کارت جیفورس GTX 580 در حالت آماده به کار، بسیار کمصداتر از GTX 480 است. هنگـام لود کـامل نیز صـدای خنـککننده این کـارت تنهـا کمـی بیشتر از رادئون HD 5870 به نظر میرسد. در کل طراحی GTX 580 یکی از بزرگترین معایب GTX 480 را به خوبی برطرف کرده است.
GIGABYTE GTX 580
کارت گرافیکی GTX 580 گیگابایت مشخصاتی مشابه با مدل مرجع دارد و تفاوت زیادی بین آنها دیده نمیشود. این کارت نیز از همان تراشههای ۴۰ نانومتری GF110 استفاده میکند و اندازه این تراشه به ۵۲۰ میلیمتر مربع میرسد. این تراشه که مدت زیادی از تولید آن نمیگذرد دارای ۳ میلیارد ترانزیستور است که قرار گرفتن آنها در یک چیپ گرافیکی رقم قابل توجهی است.
در این تراشه ۴۸ واحد ROP به کار رفته و دارای ۵۱۲ هسته کودا است. توان پردازش پیکسلی GTX 580 به ۱/۳۷ گیگاپیکسل در ثانیه میرسد و توان پردازش بافتی آن هم ۴/۴۹ گیگاتکسل در ثانیه است. با این توضیحات مشخص میشود که توان پردازشی این کارت جهش قابل توجهی نسبت به مدلهای قبلی داشته ضمن اینکه پشتیبانی از رابطهای جدید گرافیکی مانند دایرکتایکس ۱۱ و Shader Model نسخه پنجم نیز تواناییهای بیشتری را به این کارت اضافه میکنند.
حافظه استفاده شده در این کارت از نوع GDDR5 است که در ظرفیت ۵/۱ گیگابایت روی کارت قرار گرفتهاند. این حافظهها از رابط ۳۸۴ بیتی استفاده میکنند و میتوانند ۴/۱۹۲ گیگابایت در ثانیه انتقال اطلاعات داشته باشند. بنابراین محدودیتی از نظر توان حافظهها متوجه این کارت نخواهد بود.
یکی از اختلاف که میان GTX 480 و GTX 580 دیده میشود مربوط به فرکانس واحدهای پردازشی و حافظه است. در نسل قبلی، فرکانس تراشه گرافیکی ۷۰۰ مگاهرتز بود که در مدل جدید به ۷۷۲ مگاهرتز افزایش پیدا کرده است. در مورد فرکانس حافظه نیز همینطور است و از ۹۲۴ مگاهرتز در حالت پایه به ۱۰۰۲ مگاهرتز رسیده است.
البته برای به دست آوردن مقدار فرکانس موثر باید این فرکانس را با ضریب چهار محاسبه کرد که به ۴۰۰۸ مگاهرتز میرسد.
|
جای تبلیغات شما اینجا خالیست با ما تماس بگیرید
|
|