µ±Ç°Î»ÖÃ£ºÊ×Ò³ >> ¼¼ÊõÖÐÐÄ >> ´«¸Ð¼¼Êõ >> AIÐ¾Æ¬£¬FP8ÊÇ´óÊÆËùÇ÷

AIÐ¾Æ¬£¬FP8ÊÇ´óÊÆËùÇ÷

? ? 3 ÔÂ£¬Ó¢Î°´ïÍÆ³öÁËÆä GH100£¬ÕâÊÇµÚÒ»¿î»ùÓÚÈ«ÐÂ¡°Hopper¡±¼Ü¹¹µÄ GPU£¬ËüÍ¬Ê±Õë¶Ô HPC ºÍ AI ¹¤×÷¸ºÔØ£¬²¢ÇÒ¶ÔÓÚºóÕß¶øÑÔ¸üÖØÒªµÄÊÇ£¬ËüÖ§³Ö 8 Î» FP8 ¸¡µã´¦Àí¸ñÊ½¡£Á½¸öÔÂºó£¬¾ºÕù¶ÔÊÖÓ¢ÌØ¶ûÍÆ³öÁËÆäµÚ¶þ´ú AI ÑµÁ·Ð¾Æ¬Gaudi2£¬¸ÃÐ¾Æ¬Ò²²ÉÓÃ FP8 ¸ñÊ½¡£
? ? FP8 ¸ñÊ½Ö®ËùÒÔÖØÒªµÄÔÒòÓÐºÜ¶à£¬ÆäÖÐ×îÖØÒªµÄÊÇ£¬µ½Ä¿Ç°ÎªÖ¹£¬AI ÍÆÀíÖ®¼ä´æÔÚÒ»ÖÖ·ÖÁÑ£¬ÒÔÕûÊý¸ñÊ½£¨Í¨³£Îª INT8£¬µ«ÓÐÊ±Îª INT4£©ÒÔµÍ¾«¶ÈÍê³É£¬Óë AI ÑµÁ·ÒÔ FP16¡¢FP32 »ò FP64 ¾«¶ÈÍê³É£¬HPC ÒÔ FP32 »ò FP64 ¾«¶ÈÍê³É¡£Nvidia ºÍ Intel ¶¼ÈÏÎª FP8 ²»½ö¿ÉÒÔÓÃÓÚÍÆÀí£¬ÔÚÄ³Ð©Çé¿öÏÂ»¹¿ÉÒÔÓÃÓÚ AI ÑµÁ·£¬´Ó¶ø´Ó¸ù±¾ÉÏÌá¸ßÆä¼ÓËÙÆ÷µÄÓÐÐ§ÍÌÍÂÁ¿¡£
? ? ÕâºÜÖØÒª£¬ÒòÎªÔÚ¸¡µã¸ñÊ½ºÍÕûÊý¸ñÊ½Ö®¼äÀ´»ØÇÐ»»ÊÇÒ»¼þÁîÈËÍ·ÌÛµÄÊÂÇé£¬¶øÈÃËùÓÐÄÚÈÝ¶¼Í£ÁôÔÚ¸¡µãÖÐÒªÈÝÒ×µÃ¶à¡£´ËÍâ£¬ÔÚÎ´À´µÄÄ³¸öÊ±ºò£¬Èç¹ûÍÆÀí×ªÒÆµ½ 8 Î» FP8 ÉõÖÁ¿ÉÄÜÊÇ 4 Î» FP4 ¸ñÊ½£¬ÕâÒâÎ¶×Å×¨ÓÃÓÚÕûÊý´¦ÀíÆ÷µÄ±¦¹óÐ¾Æ¬¿Õ¼ä¿ÉÒÔ±»ÊÍ·Å²¢ÓÃÓÚÆäËûÓÃÍ¾¡£
? ? ÔÚºóÄ¦¶û¶¨ÂÉµÄÊÀ½çÀï£¬Ã¿Ò»¸ö¾§Ìå¹Ü¶¼ÊÇ·Ç³£ÖØÒª£¬Ã¿Ò»¸öÊ±ÖÓÖÜÆÚ¶¼ÖµµÃÕäÏ§¡£ÔÚ´¦ÀíËÙ¶ÈµÄ½ø²½Óë¹ýÈ¥Ò»Ñù¿ìµÄÊ±ºò£¬¹«Ë¾ÕýÔÚÑ°ÕÒ¸üÓÐÐ§µÄ·½·¨À´ÔËÐÐ AI ×÷Òµ¡£×éÖ¯ÐèÒªÅªÇå³þÈçºÎÀûÓÃµ±Ç°¿ÉÓÃµÄÄÜÁ¦À´Ìá¸ß´¦ÀíÄÜÁ¦¡ª¡ªÓÈÆäÊÇ ÑµÁ·ÄÜÁ¦¡£½ÏµÍ¾«¶ÈµÄÊý¾Ý¸ñÊ½»áÓÐËù°ïÖú¡£
? ? ÈË¹¤ÖÇÄÜÐ¾Æ¬ÖÆÔìÉÌÕýÔÚ¿´µ½ÕâÐ©ÓÅÊÆ¡£6 ÔÂ£¬Graphcore ·¢²¼ÁËÒ»Ïî³¤´ï30 Ò³µÄÑÐ¾¿£¬¸ÃÑÐ¾¿²»½öÕ¹Ê¾ÁËµÍ¾«¶È¸¡µã¸ñÊ½Ïà¶ÔÓÚÀàËÆ´óÐ¡µÄËõ·ÅÕûÊýµÄ×¿Ô½ÐÔÄÜ£¬¶øÇÒ»¹Õ¹Ê¾ÁË½µµÍÑµÁ·¼Æ»®ÖÐ¹¦ºÄµÄ³¤ÆÚºÃ´¦£¬°üÀ¨¿ìËÙÔö³¤µÄÄ£ÐÍ³ß´ç¡£
? ? ÑÐ¾¿ÈËÔ±Ð´µÀ£º¡°µÍ¾«¶ÈÊý×Ö¸ñÊ½¿ÉÄÜÊÇ´óÐÍ»úÆ÷Ñ§Ï°Ä£ÐÍµÄ¹Ø¼ü×é³É²¿·Ö£¬ËüÌá¹©ÁË×îÏÈ½øµÄ×¼È·ÐÔ£¬Í¬Ê±¼õÉÙÁË¶Ô»·¾³µÄÓ°Ïì¡£¡± ¡°ÌØ±ðÊÇ£¬Í¨¹ýÊ¹ÓÃ 8 Î»¸¡µãËãÊõ£¬Ïà¶ÔÓÚ float-16 ËãÊõ£¬ÄÜÁ¿Ð§ÂÊ¿ÉÒÔÌá¸ß¶à´ï 4 ±¶£¬Ïà¶ÔÓÚ float-32 ËãÊõ¿ÉÒÔÌá¸ß¶à´ï 16 ±¶¡£¡±
? ? ÏÖÔÚ Graphcore ÕýÔÚ¹Ä¶¯ IEEE ²ÉÓÃ¹©Ó¦ÉÌÎª AI Éè¼ÆµÄ FP8 ¸ñÊ½×÷ÎªÆäËûËùÓÐÈË¶¼¿ÉÒÔÊ¹ÓÃµÄ±ê×¼¡£¸Ã¹«Ë¾±¾ÖÜ½øÐÐÁËÐû´«£¬Graphcore ÁªºÏ´´Ê¼ÈË¼æÊ×Ï¯¼¼Êõ¹Ù Simon Knowles ±íÊ¾£¬¡°8 Î»¸¡µãµÄ³öÏÖÎª AI ¼ÆËãÌá¹©ÁË¾Þ´óµÄÐÔÄÜºÍÐ§ÂÊÓÅÊÆ¡£ÕâÒ²ÊÇÐÐÒµÈ·¶¨µ¥Ò»¿ª·Å±ê×¼µÄ»ú»á£¬¶ø²»ÊÇÒýÈë¾ºÕù¸ñÊ½µÄ»ìÂÒ×éºÏ¡£¡±
? ? AMD ºÍ¸ßÍ¨Ò²Ö§³Ö Graphcore µÄ¼Æ»®£¬Qualomm ²úÆ·¹ÜÀí¸ß¼¶×Ü¼à John Kehrli ±íÊ¾£¬¸ÃÌáÒé¡°ÒÑ³ÉÎª 8 Î»¸¡µã¼ÆËãµÄÒ»ÖÖÒýÈË×¢Ä¿µÄ¸ñÊ½£¬ÎªÍÆÀíºÍ¼ÆËãÌá¹©ÁËÏÔÖøµÄÐÔÄÜºÍÐ§ÂÊÌáÉý¡£¿ÉÒÔ°ïÖú½µµÍÔÆºÍ±ßÔµµÄÑµÁ·ºÍÍÆÀí³É±¾¡£¡±
? ? AMD Ô¤¼Æ½«ÔÚ¼´½«ÍÆ³öµÄ Instinct MI300A APUÖÐÖ§³Ö FP8 ¸ñÊ½£¬Ëü½« AMD GPU ºÍ Epyc 7004 ´¦ÀíÆ÷Èû½øÒ»¸ö·â×°ÖÐ¡£ÎÒÃÇÔ¤¼ÆÒ²»áÓÐÆÕÍ¨µÄ MI300 ¶ÀÁ¢ GPU£¬²¢ÇÒËüÃÇÒ²½«Ö§³Ö FP8 Êý¾ÝºÍ´¦Àí¡£
? ? Ëü»¹½«Ê¹°üÀ¨ SambaNova¡¢Cerebras ºÍ Groq ÔÚÄÚµÄÒ»ÏµÁÐ AI Ð¾Æ¬ÖÆÔìÉÌÊÜÒæ¡£
? ? Graphcore ÈÏÎª£¬Ê¹ÓÃ½ÏµÍ¾«¶ÈºÍ»ìºÏ¾«¶ÈµÄ¸ñÊ½£¨ÀýÈçÍ¬Ê±Ê¹ÓÃ 16 Î»ºÍ 32 Î»£©ÔÚ AI ÖÐºÜ³£¼û£¬²¢ÇÒÔÚÄ¦¶û¶¨ÂÉºÍµÇÄÉµÂËõ·ÅËÙ¶È·Å»ºÖ®¼ÊÔÚ×¼È·ÐÔºÍÐ§ÂÊÖ®¼äÈ¡µÃÁËÁ¼ºÃµÄÆ½ºâ¡£
? ? FP8 ÈÃ AI ÐÐÒµÓÐ»ú»á½ÓÊÜ¡°AI-native¡±±ê×¼ÒÔ¼°¿çÏµÍ³µÄÍÆÀíºÍÑµÁ·»¥²Ù×÷ÐÔ¡£ÔÚ IEEE ÕýÊ½ÖÆ¶¨±ê×¼Ö®Ç°£¬Graphcore »¹½«ÏòÒµÄÚÆäËûÈËÌá¹©Æä¹æ·¶¡£
? ? ¡°Ëæ×ÅÉî¶ÈÑ§Ï°Ó¦ÓÃ³ÌÐò¸´ÔÓÐÔµÄ²»¶ÏÔö¼Ó£¬»úÆ÷Ñ§Ï°ÏµÍ³µÄ¿ÉÀ©Õ¹ÐÔÒ²±äµÃ²»¿É»òÈ±£¬¡±Graphcore ÑÐ¾¿ÈËÔ±ÔÚËûÃÇµÄÂÛÎÄÖÐÐ´µÀ¡£¡°´óÐÍ·Ö²¼Ê½Ä£ÐÍµÄÑµÁ·´øÀ´ÁËÐí¶àÌôÕ½£¬ÒÀÀµÓÚÓÐÐ§Ê¹ÓÃ²»Í¬½ÚµãÖ®¼ä¹²ÏíµÄ¿ÉÓÃ¼ÆËã¡¢ÄÚ´æºÍÍøÂç×ÊÔ´£¬²¢ÊÜµ½¿ÉÓÃ¹¦ÂÊÔ¤ËãµÄÏÞÖÆ¡£ÔÚÕâÖÖÇé¿öÏÂ£¬Ê¹ÓÃÓÐÐ§µÄÊý×Ö¸ñÊ½ÖÁ¹ØÖØÒª£¬ÒòÎªÔÚ´¦Àíµ¥ÔªÖ®¼ä½»»»Êý¾ÝÊ±£¬Ëü¿ÉÒÔÌá¸ß¼ÆËãÐ§ÂÊºÍÍ¨ÐÅÐ§ÂÊ£¬´Ó¶øÌá¸ß¹¦ÂÊÐ§ÂÊ¡£
? ? Ò»¶ÎÊ±¼äÒÔÀ´£¬Ð¾Æ¬ÖÆÔìÉÌÒ»Ö±ÔÚÆÀ¹ÀµÍ¾«¶È¸ñÊ½µÄÊ¹ÓÃ¡£2019 Äê£¬ IBM ÑÐ¾¿ÔºÍÆ³öÁËÒ»¿î»ùÓÚ 7 ÄÉÃ× EUV ¼¼ÊõµÄËÄºË AI Ð¾Æ¬£¬Ö§³Ö FP16 ºÍ»ìºÏ FP8 ¸ñÊ½µÄÑµÁ·ºÍÍÆÀí¡£
? ? ¡°ÕâÖÖÐÂµÄ»ìºÏÑµÁ··½·¨ÔÚ¸ü¹ã·ºµÄÉî¶ÈÑ§Ï°Ä£ÐÍÖÐÍêÈ«±£ÁôÁËÄ£ÐÍµÄ×¼È·ÐÔ£¬¡±IBM Research ×¨¼ÒÔÚÒ»Æª²©ÎÄÖÐÐ´µÀ¡£¡°»ìºÏ FP8 Î»¸ñÊ½»¹¿Ë·þÁËÖ®Ç°ÔÚ MobileNet (Vision) ºÍ Transformer (NLP) µÈÄ£ÐÍÉÏµÄÑµÁ·¾«¶ÈËðÊ§£¬ÕâÐ©Ä£ÐÍ¸üÈÝÒ×ÊÜµ½Á¿»¯ÐÅÏ¢¶ªÊ§µÄÓ°Ïì¡£ÎªÁË¿Ë·þÕâÒ»ÌôÕ½£¬Hybrid FP8 ·½°¸ÔÚÇ°ÏòÂ·¾¶ÖÐ²ÉÓÃÁËÒ»ÖÖÐÂÓ±µÄ FP8 Î»¸ñÊ½ÒÔÊµÏÖ¸ü¸ß·Ö±æÂÊ£¬¶øÔÚºóÏòÂ·¾¶ÖÐ²ÉÓÃÁíÒ»ÖÖ FP8 Î»¸ñÊ½ÓÃÓÚ¸ü´ó·¶Î§µÄÌÝ¶È¡£¡±
? ? Á½Äêºó£¬IBMÏò2021 Äê ISSCC »î¶¯Õ¹Ê¾ÁËÒ»¿îÖ§³Ö 16 Î»ºÍ 8 Î»ÑµÁ·ÒÔ¼° 4 Î»ºÍ 2 Î»ÍÆÀíµÄ²âÊÔÐ¾Æ¬¡£
? ? IBM ÑÐ¾¿ÈËÔ±µ±Ê±Ð´µÀ£º¡°ÈË¹¤ÖÇÄÜÄ£ÐÍµÄ¸´ÔÓÐÔºÍ²ÉÓÃÂÊÕýÔÚÑ¸ËÙÀ©´ó£¬ÏÖÔÚ±»ÓÃÓÚÒ©Îï·¢ÏÖ¡¢ÒÅÁô IT Ó¦ÓÃ³ÌÐòµÄÏÖ´ú»¯ÒÔ¼°ÎªÐÂÓ¦ÓÃ³ÌÐò±àÐ´´úÂë¡£¡± ¡°µ«ÈË¹¤ÖÇÄÜÄ£ÐÍ¸´ÔÓÐÔµÄ¿ìËÙ·¢Õ¹Ò²Ôö¼ÓÁË¼¼ÊõµÄÄÜÔ´ÏûºÄ£¬Ò»¸ö´óÎÊÌâÊÇÔÚ²»Ôö¼ÓÌ¼×ã¼£µÄÇé¿öÏÂ´´½¨¸´ÔÓµÄÈË¹¤ÖÇÄÜÄ£ÐÍ¡£´ÓÀúÊ·ÉÏ¿´£¬¸ÃÁìÓòÖ»ÊÇ¼òµ¥µØ½ÓÊÜÁË£¬Èç¹û¼ÆËãÐèÇóºÜ´ó£¬ÄÇÃ´ÎªÆäÌá¹©È¼ÁÏËùÐèµÄ¹¦ÂÊÒ²½«Èç´Ë¡£¡±
? ? ÏÖÔÚ£¬ËùÓÐÈË¾Û¼¯ÔÚÒ»Æð£¬²¢ÓÐÍû´´½¨Ò»¸ö±ê×¼¡£

ÉÏÒ»Æª:É½Î÷ÃºÌ¿¸»ºÀµÄ¶ù×Ó×öÐ¾Æ¬£¬ÒªIPOÁË

ÏÂÒ»Æª:ÊÐ³¡ÏÂÐÐÏ¸·ÖÐèÇóÍ¹ÏÔ£¬°²Ä±¿Æ¼¼×ÔÑÐIPÖúÁ¦²úÒµÍ»Î§

¸ü¶à¾«²ÊÄÚÈÝ£º

Ð¾Æ¬ ¸¡µã

Ïà¹ØÎÄÕÂ

ÓÃ»§ÆÀÂÛ

·¢ÆÀÂÛËÍ»ý·Ö£¬²ÎÓë¾ÍÓÐ½±Àø£¡

·¢±íÆÀÂÛ

ÆÀÂÛÄÚÈÝ£º·¢±íÆÀÂÛ²»ÄÜÇë²»Òª³¬¹ý250×Ö£»·¢±íÆÀÂÛÇë×Ô¾õ×ñÊØ»¥ÁªÍøÏà¹ØÕþ²ß·¨¹æ¡£

ÓÃ»§Ãû£º