×Ö½ÚÌø¶¯Êý¾ÝÆ½Ì¨¼¼Êõ½ÒÃØ£º»ùÓÚClickHouseµÄ¸´ÔÓ²éÑ¯ÊµÏÖÓëÓÅ»¯ Ô´´ ¾«Ñ¡

ClickHouse×÷ÎªÄ¿Ç°ÒµÄÚÖ÷Á÷µÄÁÐÊ½´æ´¢Êý¾Ý¿â(DBMS)Ö®Ò»£¬ÓµÓÐ×ÅÍ¬ÀàÐÍDBMSÄÑÒÔÆó¼°µÄ²éÑ¯ËÙ¶È¡£×÷Îª¸ÃÁìÓòÖÐµÄºóÆðÖ®Ðã£¬ClickHouseÒÑÆ¾½èÆäÐÔÄÜÓÅÊÆÒýÁìÁËÒµÄÚÐÂÒ»ÂÖ·ÖÎöÐÍÊý¾Ý¿âµÄÈÈ³±¡£µ«Ëæ×ÅÆóÒµÒµÎñÊý¾ÝÁ¿µÄ²»¶ÏÀ©´ó£¬ÔÚ¸´ÔÓquery³¡¾°ÏÂ£¬ClickHouseÈÝÒ×´æÔÚ²éÑ¯Òì³£ÎÊÌâ£¬Ó°ÏìÒµÎñÕý³£ÍÆ½ø¡£

×Ö½ÚÌø¶¯×÷Îª¹úÄÚ×î´ó¹æÄ£µÄClickHouseÊ¹ÓÃÕß£¬ÔÚ¶ÔClickHouseµÄÓ¦ÓÃÓëÓÅ»¯¹ý³ÌÖÐ»ýÀÛÁË´óÁ¿¼¼Êõ¾Ñé¡£ÔÚ½üÈÕµÄ¡¾T¡¤Talk¡¿ÏµÁÐ¼¼Êõ·ÖÏí»î¶¯µÄµÚ11ÆÚÖÐ£¬ÎÒÃÇÌØ±ðÑûÇëµ½ÁË×Ö½ÚÌø¶¯Êý¾ÝÆ½Ì¨×ÊÉîÑÐ·¢¹¤³ÌÊ¦¶Ò»·åÀÏÊ¦Îª¹ã´óÌýÖÚ½âÎöClickHouseµÄ¸´ÔÓ²éÑ¯ÎÊÌâ£¬¶Ò»·åÀÏÊ¦Ò²ÔÚÖ±²¥¹ý³ÌÖÐÊ×´Î¹«¿ª·ÖÏíÁË×Ö½ÚÌø¶¯½â¾öClickHouse¸´ÔÓ²éÑ¯ÎÊÌâµÄÓÅ»¯Ë¼Â·Óë¼¼ÊõÏ¸½Ú¡£¡¾T¡¤Talk¡¿½«±¾´ÎµÄºËÐÄÄÚÈÝ½øÐÐÁËÕûÀí£¬Ï£ÍûÄÜ¸ø´ó¼Ò´øÀ´Ò»Ð©Æô·¢£º

ÏîÄ¿±³¾°?

ClickHouseµÄÖ´ÐÐÄ£Ê½ÓëDruid¡¢ESµÈ´óÊý¾ÝÒýÇæÀàËÆ£¬Æä»ù±¾µÄ²éÑ¯Ä£Ê½¿É·ÖÎªÁ½¸ö½×¶Î¡£µÚÒ»½×¶Î£¬CoordinatorÔÚÊÕµ½²éÑ¯ºó£¬½«ÇëÇó·¢ËÍ¸ø¶ÔÓ¦µÄWorker½Úµã¡£µÚ¶þ½×¶Î£¬Worker½ÚµãÍê³É¼ÆËã£¬CoordinatorÔÚÊÕµ½¸÷Worker½ÚµãµÄÊý¾Ýºó½øÐÐ»ã¾ÛºÍ´¦Àí£¬²¢½«´¦ÀíºóµÄ½á¹û·µ»Ø¡£

Í¼Æ¬

Á½½×¶ÎµÄÖ´ÐÐÄ£Ê½ÄÜ¹»½ÏÎª¸ßÐ§µØÖ§³ÖÄ¿Ç°Ðí¶à³£¼ûµÄÒµÎñ³¡¾°£¬ÀýÈç¸÷Àà´ó¿í±íµ¥µÄ²éÑ¯£¬ÕâÒ²ÊÇClickHouse×îÉÃ³¤µÄ³¡¾°¡£ClickHouseµÄÓÅµãÊÇ¼òµ¥¡¢¸ßÐ§£¬Í¨³£À´Ëµ£¬¼òµ¥¾ÍÒâÎ¶×Å¸ßÐ§¡£µ«Ëæ×ÅÆóÒµÒµÎñµÄ³ÖÐø·¢Õ¹£¬Óú¼Ó¸´ÔÓµÄÒµÎñ³¡¾°¶ÔClickHouseÌá³öÁËÒÔÏÂÈýÀàÌôÕ½¡£

µÚÒ»Àà£¬µ±Ò»½×¶Î·µ»ØµÄÊý¾Ý½Ï¶à£¬ÇÒ¶þ½×¶Î¼ÆËã½ÏÎª¸´ÔÓÊ±£¬Coordinator»á³ÐÊÜ½Ï´óÑ¹Á¦£¬ÈÝÒ×³ÉÎªQueryµÄÆ¿¾±¡£ÀýÈçÒ»Ð©ÖØ¼ÆËãµÄAggËã×Ó£¬ÈçCount Distinct£¬Èô²ÉÓÃ¹þÏ£±íµÄ·½Ê½½øÐÐÈ¥ÖØ£¬µÚ¶þ½×¶ÎÐèÔÚCoordinatorµ¥»úÉÏÈ¥ºÏ²¢¸÷¸öWorkerµÄ¹þÏ£±í¡£Õâ¸ö¼ÆËãÁ¿»áºÜÖØÇÒÎÞ·¨²¢ÐÐ¡£

µÚ¶þÀà£¬ÓÉÓÚÄ¿Ç°ClickHouseÄ£Ê½²¢²»Ö§³ÖShuffle£¬Òò´Ë¶ÔÓÚJoin¶øÑÔ£¬ÓÒ±í±ØÐëÎªÈ«Á¿Êý¾Ý¡£ÎÞÂÛÊÇÆÕÍ¨Join»¹ÊÇGlobal Join£¬µ±ÓÒ±íµÄÊý¾ÝÁ¿½Ï´óÊ±£¬Èô½«Êý¾Ý¶¼·Åµ½ÄÚ´æÖÐ£¬»á±È½ÏÈÝÒ×OOM¡£Èô½«Êý¾Ýspillµ½´ÅÅÌ£¬ËäÈ»¿ÉÒÔ½â¾öÄÚ´æÎÊÌâ£¬µ«ÓÉÓÚÓÐ´ÅÅÌ IO ºÍÊý¾ÝÐòÁÐ»¯¡¢·´ÐòÁÐ»¯µÄ´ú¼Û£¬Òò´Ë²éÑ¯µÄÐÔÄÜ»áÊÜµ½Ó°Ïì¡£ÌØ±ðÊÇµ±Join²ÉÓÃHash JoinÊ±£¬Èç¹ûÓÒ±íÊÇÒ»ÕÅ´ó±í£¬¹¹½¨Ò²»á±È½ÏÂý¡£Õë¶Ô¹¹½¨ÎÊÌâ£¬½üÆÚÉçÇøÒ²½øÐÐÁËÒ»Ð©ÓÒ±í²¢ÐÐ¹¹½¨µÄÓÅ»¯£¬Êý¾Ý°´ÕÕJoin key½øÐÐSplitÀ´²¢ÐÐµØ¹¹½¨¶à¸öHash Table£¬µ«¶îÍâµÄ´ú¼ÛÊÇ×óÓÒ±í¶¼ÐèÒªÔö¼ÓÒ»´ÎSplit²Ù×÷¡£

µÚÈýÀà£¬ÔòÊÇ¹ØÓÚ¸´ÔÓ²éÑ¯£¨Èç¶à±í Join¡¢Ç¶Ì×¶à¸ö×Ó²éÑ¯¡¢window function µÈ£©£¬ClickHouse¶ÔÕâÀàÐèÇó³¡¾°µÄÖ§³Ö²¢²»ÊÇÌØ±ðÓÑºÃ£¬ÓÉÓÚClickHouse²¢²»ÄÜÍ¨¹ýShuffleÀ´·ÖÉ¢Êý¾ÝÔö¼ÓÖ´ÐÐ²¢ÐÐ¶È£¬²¢ÇÒÆäÉú³ÉµÄPipelineÔÚÒ»Ð©caseÏÂ²¢²»ÄÜ³ä·Ö²¢ÐÐ¡£Òò´ËÔÚÄ³Ð©³¡¾°ÏÂ£¬ÄÑÒÔ·¢»Ó¼¯ÈºµÄÈ«²¿×ÊÔ´¡£

Ëæ×ÅÆóÒµÒµÎñ¸´ÔÓ¶ÈµÄ²»¶ÏÌáÉý£¬¸´ÔÓ²éÑ¯£¬ÌØ±ðÊÇÓÐ¶àÂÖµÄ·Ö²¼Ê½Join£¬ÇÒÓÐºÜ¶àaggµÄ¼ÆËãµÄÐèÇó»áÔ½À´Ô½Ç¿ÁÒ¡£ÔÚÕâÖÖÇé¿öÏÂ£¬ÒµÎñ²¢²»Ï£ÍûËùÓÐµÄQuery¶¼°´ÕÕClickHouseÉÃ³¤µÄÄ£Ê½½øÐÐ£¬¼´Í¨¹ýÉÏÓÎÊý¾Ý ETL À´²úÉú´ó¿í±í¡£ÕâÑù×ö¶ÔETLµÄ³É±¾½Ï´ó£¬²¢ÇÒ¿ÉÄÜ»áÓÐÒ»Ð©Êý¾ÝÈßÓà¡£

Í¼Æ¬

ÆóÒµµÄ¼¯Èº×ÊÔ´ÊÇÓÐÏÞµÄ£¬µ«ÕûÌåµÄÊý¾ÝÁ¿»á³ÖÐøÔö³¤£¬Òò´ËÔÚÕâÖÖÇé¿öÏÂ£¬ÎÒÃÇÏ£ÍûÄÜ¹»³ä·ÖµØÈ¥ÀûÓÃ»úÆ÷µÄ×ÊÔ´£¬À´Ó¦¶ÔÕâÖÖÔ½À´Ô½¸´ÔÓµÄÒµÎñ³¡¾°ºÍSQL¡£ËùÒÔÎÒÃÇµÄÄ¿±êÊÇ»ùÓÚClickHouseÄÜ¹»¸ßÐ§Ö§³Ö¸´ÔÓ²éÑ¯¡£

¼¼Êõ·½°¸?

¶ÔÓÚClickHouse¸´ÔÓ²éÑ¯µÄÊµÏÖ£¬ÎÒÃÇ²ÉÓÃÁË·ÖStageµÄÖ´ÐÐ·½Ê½£¬À´Ìæ»»µôÄ¿Ç°ClickHouseµÄÁ½½×¶ÎÖ´ÐÐ·½Ê½¡£ÀàËÆÓÚÆäËûµÄ·Ö²¼Ê½Êý¾Ý¿âÒýÇæ£¬ÀýÈçPrestoµÈ£¬»á½«Ò»¸ö¸´ÔÓµÄQuery°´Êý¾Ý½»»»Çé¿öÇÐ·Ö³É¶à¸ö Stage£¬¸÷StageÖ®¼äÔòÍ¨¹ýExchangeÍê³ÉÊý¾Ý½»»»¡£StageÖ®¼äµÄÊý¾Ý½»»»Ö÷ÒªÓÐÒÔÏÂÈýÖÖÐÎÊ½¡£

°´ÕÕµ¥¸ö»òÕß¶à¸ökey½øÐÐShuffle
½«µ¥¸ö»òÕß¶à¸ö½ÚµãµÄÊý¾Ý»ã¾Ûµ½Ò»¸ö½ÚµãÉÏ£¬³ÆÎªGather
½«Í¬Ò»·ÝÊý¾Ý¸´ÖÆµ½¶à¸ö½ÚµãÉÏ£¬³ÆÎªBroadcast»ò¹ã²¥

¶ÔÓÚµ¥¸öStageÖ´ÐÐ£¬¼ÌÐø¸´ÓÃClickHouseÄ¿Ç°µ×²ãµÄÖ´ÐÐ·½Ê½¡£¿ª·¢ÉÏ°´ÕÕ²»Í¬¹¦ÄÜÇÐ·Ö²»Í¬Ä£¿é¡£¸÷¸öÄ£¿éÔ¤¶¨½Ó¿Ú£¬¼õÉÙ±Ë´ËµÄÒÀÀµÓëñîºÏ¡£¼´Ê¹Ä£¿é·¢Éú±ä¶¯»òÄÚ²¿Âß¼µ÷Õû£¬Ò²²»»áÓ°ÏìÆäËûÄ£¿é¡£Æä´Î£¬¶ÔÄ£¿é²ÉÓÃ²å¼þ¼Ü¹¹£¬ÔÊÐíÄ£¿é°´ÕÕÁé»îÅäÖÃÖ§³Ö²»Í¬µÄ²ßÂÔ¡£ÕâÑù±ãÄÜ¹»¸ù¾Ý²»Í¬ÒµÎñ³¡¾°ÊµÏÖ²»Í¬µÄ²ßÂÔ¡£

Í¼Æ¬

Ê×ÏÈ£¬µ±Coordinator½ÓÊÜ¸´ÔÓµÄ²éÑ¯ÒÔºó£¬Ëü»áÔÚµ±Ç°µÄÓï·¨Ê÷µÄ»ù´¡ÉÏ£¬¸ù¾Ý½ÚµãÀàÐÍºÍÊý¾Ý·Ö²¼Çé¿ö£¬²åÈëExchange½Úµã£¬²¢Éú³ÉÒ»¸ö·Ö²¼Ê½Plan¡£Æä´Î£¬Coordinator½Úµã»á¸ù¾ÝExchangeNodeÀàÐÍÇÐ·ÖPlan£¬²¢Éú³ÉÃ¿¸öStageÖ´ÐÐ¼Æ»®Æ¬¶Î¡£

½Ó×Å£¬Coordinator½Úµã»áµ÷ÓÃSegmentSchedulerµ÷¶ÈÆ÷£¬½«¸÷StageµÄPlanSegment·¢ËÍ¸øWorker½Úµã¡£µ±Worker½ÓÊÕµ½PlanSegmentºó£¬InterpreterPlanSegment»áÍê³ÉÊý¾ÝµÄ¶ÁÈ¡ºÍÖ´ÐÐ£¬Í¨¹ýExchangeManagerÍê³ÉÊý¾ÝµÄ½»»¥¡£×îºó£¬Coordinator´Ó×îºóÒ»ÂÖStageËù¶ÔÓ¦µÄExchangeManagerÖÐÈ¥¶ÁÈ¡Êý¾Ý£¬²¢·µ»Ø¸øClient¡£

²éÑ¯Æ¬¶Îµ÷¶ÈÆ÷SegmentScheduler¸ºÔðµ÷¶È²éÑ¯²»Í¬µÄPlanSegment£¬¸ù¾ÝÉÏÏÂÓÎÒÀÀµ¹ØÏµºÍÊý¾Ý·Ö²¼£¬ÒÔ¼°Stage²¢ÐÐ¶ÈºÍworker·Ö²¼ºÍ×´Ì¬ÐÅÏ¢£¬°´ÕÕÒ»¶¨µÄµ÷¶È²ßÂÔ£¬½«PlanSemgent·¢¸ø²»Í¬µÄ Worker ½Úµã¡£

Í¼Æ¬

Ä¿Ç°¶øÑÔ£¬ÎÒÃÇÔÚ½øÐÐ¼Æ»®ÏÂ·¢ºÍµ÷¶ÈÊ±£¬Ö÷ÒªÊµÏÖÁËÁ½ÖÖ²ßÂÔ¡£

µÚÒ»ÖÖÊÇÒÀÀµµ÷¶È£¬¸ù¾ÝStageÒÀÀµ¹ØÏµ¶¨ÒåÍØÆË½á¹¹£¬²úÉúDAGÍ¼£¬²¢¸ù¾ÝDAGÍ¼µ÷¶ÈStage¡£ÒÀÀµµ÷¶ÈÒªµÈµ½ÒÀÀµStageÆô¶¯ÒÔºó£¬²Å»áµ÷¶È¶ÔÓ¦µÄStage¡£ÀýÈçÁ½±íJoin£¬»áÏÈµ÷¶È×óÓÒ±í¶ÁÈ¡Stage£¬Ö®ºóÔÙµ÷¶ÈJoinÕâ¸öStage£¬ÒòÎªJoinµÄStageÒÀÀµÓÚ×óÓÒ±íµÄStage¡£

µÚ¶þÖÖÊÇAllAtOnce²ßÂÔ£¬ÏÈ¼ÆËãÃ¿¸öStageµÄÏà¹ØÐÅÏ¢£¬ºóÒ»´ÎÐÔµ÷¶ÈËùÓÐStage¡£

Ïà±È¶øÑÔ£¬ÕâÁ½ÖÖ²ßÂÔÊÇÔÚÈÝ´í¡¢×ÊÔ´Ê¹ÓÃºÍÑÓÊ±ÉÏÈ¥×öÈ¡Éá¡£µÚÒ»ÖÖ²ßÂÔÒÀÀµµ÷¶È£¬¿ÉÒÔÊµÏÖ¸üºÃµÄÈÝ´í¡£ÓÉÓÚClickHouseÊý¾Ý¿ÉÒÔÓÐ¶à¸ö¸±±¾£¬¶ÁÊý¾ÝÊ±£¬Èç²¿·Ö½ÚµãÁ¬½ÓÊ§°Ü£¬¿ÉÒÔ³¢ÊÔËüµÄ¸±±¾½Úµã¡£¶ÔºóÐøÒÀÀµµÄ½ÚµãµÄStageÀ´Ëµ£¬²¢²»ÐèÒª¸ÐÖªµ½Ç°Ãæ Stage µÄÖ´ÐÐÇé¿ö¡£·ÇSource Stage£¬±¾ÉíÃ»ÓÐ¶ÔÊý¾ÝµÄÒÀÀµ£¬ËùÒÔÈÝ´íÄÜÁ¦»á¸üÇ¿£¬Ö»Òª±£Ö¤Stage²¢ÐÐ¶ÈµÄ½Úµã´æ»î¼´¿É¡£ÉõÖÁ¼«¶ËÇé¿öÏÂ£¬ÈçÐè±£Ö¤QueryÕý³£Ö´ÐÐ£¬Ò²¿ÉÒÔ½µµÍStageµÄ²¢ÐÐ¶È¡£µ«µ÷¶È´æÔÚÒÀÀµ¹ØÏµ£¬²¢²»ÄÜÍêÈ«²¢ÐÐ£¬»áÔö¼Óµ÷¶ÈµÄÊ±³¤¡£Stage½Ï¶àµÄÇé¿öÏÂ£¬µ÷¶ÈÑÓÊ±¿ÉÄÜ»áÕ¼¾ÝSQLÕûÌå²»Ð¡µÄ±ÈÀý¡£Õë¶ÔÉÏÊöÎÊÌâµÄ¿É×öÈçÏÂÓÅ»¯£º¶ÔÓÚÒ»Ð©Ã»ÓÐÒÀÀµ¹ØÏµµÄ£¬¾¡¿ÉÄÜÖ§³Ö²¢ÐÐ¡£ÀýÈçÍ¬Ò»¸öStageµÄ²»Í¬½Úµã£¬¿ÉÒÔ²¢ÐÐ¡£Ã»ÓÐÒÀÀµ¹ØÏµµÄStage£¬Ò²¿ÉÒÔ²¢ÐÐ¡£

AllAtOnce²ßÂÔ£¬Í¨¹ý²¢ÐÐ¿ÉÒÔ¼«´ó½µµÍµ÷¶ÈÑÓÊ±¡£Îª·ÀÖ¹³öÏÖ´óÁ¿ÍøÂçIOÏß³Ì£¬¿ÉÒÔÍ¨¹ýÒì²½»¯ÊÖ¶Î¿ØÖÆÏß³ÌÊýÄ¿¡£AllAtOnce²ßÂÔµÄÈ±µãÊÇÈÝ´íÐÔÃ»ÓÐÒÀÀµµ÷¶ÈºÃ£¬Ã¿Ò»¸öStageµÄWorkerÔÚµ÷¶ÈÇ°¾ÍÒÑ¾È·¶¨ÁË£¬µ÷¶È¹ý³ÌÖÐÓÐÒ»¸öWorker³öÏÖÁ¬½ÓÒì³££¬ÔòÕû¸öQuery¶¼»áÊ§°Ü¡£ÁíÒ»ÀàÇé¿ö£¬StageÔÚÉÏÓÎÊý¾Ý»¹Ã»ÓÐready£¬¾Í±»µ÷¶ÈÆðÀ´ÁË£¬ÔòÐèÒª½Ï³¤Ê±¼äµÈÊý¾Ý¡£ÀýÈçFinalµÄagg Stage£¬ÒªµÈPartial aggÍê³ÉÒÔºó²ÅÄÜ¹»ÄÃµ½¶ÔÓ¦µÄÊý¾Ý¡£ËäÈ»ÎÒÃÇÒ²¶Ô´Ë½øÐÐÁËÒ»Ð©ÓÅ»¯£¬²¢²»»á³¤Ê±¼ä¿ÕÅÜ£¬ÀË·ÑCPU×ÊÔ´¡£µ«ÊÇÆäÊµÒ²ÏûºÄÁËÒ»²¿·Ö×ÊÔ´£¬ÀýÈçÐèÒªÈ¥´´½¨ÕâÐ©Ö´ÐÐµÄÏß³Ì¡£

ClickHouseµÄ²éÑ¯½ÚµãÖ´ÐÐÖ÷ÒªÊÇÒÔSQLÐÎÊ½ÔÚ½Úµã¼ä»¥Ïà½»»¥¡£ÔÚÇÐ·ÖStageºó£¬ÎÒÃÇÐèÒªÖ§³ÖÄÜ¹»Ö´ÐÐÒ»¸öµ¥¶ÀµÄPlanSegmentµÄÖ´ÐÐ¼Æ»®¡£Òò´Ë£¬InterpreterPlanSegmentÖ÷ÒªµÄ×÷ÓÃ¾ÍÊÇ½ÓÊÜÒ»¸öÐòÁÐ»¯ºóµÄPlanSegment£¬ÄÜ¹»ÔÚWorker½ÚµãÉÏÈ¥ÔËÐÐÕû¸öPlanSegmentµÄÂß¼¡£´ËÍâ£¬ÎÒÃÇÒ²½øÐÐÁË¹¦ÄÜºÍÐÔÄÜÉÏµÄÔöÇ¿£¬ÀýÈçÖ§³ÖÒ»¸öStage´¦Àí¶à¸öJoin£¬ÕâÑù±ã¿ÉÒÔ¼õÉÙStageµÄÊýÄ¿ºÍÒ»Ð©²»±ØÒªµÄ´«Êä£¬ÓÃÒ»¸öStage¾Í¿ÉÒÔÍê³ÉÕû¸öJoinµÄ¹ý³Ì¡£InterpreterPlanSegmentµÄÖ´ÐÐ»áÉÏ±¨¶ÔÓ¦µÄ×´Ì¬ÐÅÏ¢£¬Èç³öÏÖÖ´ÐÐÒì³££¬»á½«Òì³£ÐÅÏ¢±¨¸æ¸ø²éÑ¯Æ¬¶Îµ÷¶ÈÆ÷£¬µ÷¶ÈÆ÷»áÈ¡ÏûQueryÆäËûµÄStageµÄWorkerÖ´ÐÐ¡£

ExchangeManagerÊÇPlanSegmentÊý¾Ý½»»»µÄÃ½½é£¬ÄÜÆ½ºâÊý¾ÝÉÏÏÂÓÎ´¦ÀíµÄÄÜÁ¦¡£ÕûÌå¶øÑÔ£¬ÎÒÃÇµÄÉè¼Æ²ÉÓÃPushÓë¶ÓÁÐµÄ·½Ê½£¬µ±ÉÏÓÎµÄÊý¾ÝreadyÊ±£¬Ö÷¶¯ÍÆËÍ¸øÏÂÓÎ£¬²¢ÔÚÕâ¸ö»ù´¡ÉÏÖ§³ÖÁË·´Ñ¹µÄÄÜÁ¦¡£

Í¼Æ¬

ÔÚÕû¸öÁ÷³ÌÖÐ£¬ÉÏÏÂÓÎ¶¼»áÍ¨¹ý¶ÓÁÐÀ´ÓÅ»¯·¢ËÍºÍ¶ÁÈ¡£¬ÉÏÓÎÓëÏÂÓÎ»áÓÐÒ»¸ö×Ô¼ºµÄ¶ÓÁÐ¡£µ±¶ÓÁÐ±¥ºÍµÄÊ±ºò£¬»áÍ¨¹ýÀàËÆ·´Ñ¹µÄ»úÖÆÀ´¿ØÖÆÉÏÓÎÕâ¸öÖ´ÐÐËÙ¶È£¬ÈôÉÏÓÎ¼ÆËã¿ì£¬ÏÂÓÎ´¦ÀíÄÜÁ¦±È½ÏÂý£¬³öÏÖÏÂÓÎ´¦Àí²»¹ýÀ´µÄÇé¿ö£¬Ôò»áÍ¨¹ý·´Ñ¹µÄ·½Ê½À´¿ØÖÆÉÏÓÎÖ´ÐÐµÄËÙ¶È¡£

ÓÉÓÚ²ÉÓÃpushºÍ¶ÓÁÐ£¬Òò´ËÒª¿¼ÂÇÒ»¸öÏà¶Ô±È½ÏÌØÊâµÄ³¡¾°£¬ÔÚÄ³Ð©caseµÄÇé¿öÏÂ£¬ÏÂÓÎµÄStage²¢²»ÐèÒª¶ÁÈ¡È«²¿µÄÉÏÓÎµÄÊý¾Ý¡£ÀýÈçLimit100£¬ÏÂÓÎÖ»Ðè¶ÁÈ¡100ÌõÊý¾Ý£¬¶øÉÏÓÎ¿ÉÄÜ»á²úÉú·Ç³£´ó¹æÄ£µÄÊý¾Ý¡£Òò´ËÔÚÕâÖÖÇé¿öÏÂ£¬µ±ÏÂÓÎµÄStage¶ÁÈ¡µ½×ã¹»µÄÊý¾Ýºó£¬ËüÐèÒªÄÜ¹»Ö÷¶¯È¡ÏûÉÏÓÎStageµÄÖ´ÐÐ£¬²¢ÇÒÇå¿Õ¶ÓÁÐ¡£

ExchangeManager¿¼ÂÇµÄÓÅ»¯µã½Ï¶à£¬ÀýÈçÏ¸Á£¶ÈµÄÄÚ´æ¿ØÖÆ£¬ÄÜ¹»°´ÕÕÊµÀý¡¢Query¡¢SegmentµÈ¶à¸ö²ã´Î½øÐÐÄÚ´æ¿ØÖÆ£¬±ÜÃâOOM¡£¸ü³¤ÆÚµÄ¿¼ÂÇÊÇÔÚÒ»Ð©¶ÔÑÓ³ÙÒªÇó²»¸ß¡¢Êý¾ÝÁ¿´óµÄ³¡¾°¡£µÚÒ»£¬Í¨¹ý½«Êý¾Ý Spill µ½´ÅÅÌ£¬½µµÍÄÚ´æµÄÊ¹ÓÃ¡£

Í¼Æ¬

µÚ¶þ£¬ÎªÁËÌáÉý´«ÊäÐ§ÂÊ£¬Ð¡Êý¾ÝÒª×öMerge£¬´óÊý¾ÝÒª×öSplit¡£Í¬Ê±£¬ÔÚÍøÂç´«ÊäºÍ´¦ÀíÄ³Ð©³¡¾°µÄÊ±ºò£¬ÐèÒª×öÒ»ÖÖÓÐÐòÐÔµÄ±£Ö¤¡£ÀýÈçÔÚSortµÄ³¡¾°£¬Partial SortºÍMerge SortµÄÍøÂç´«Êä¹ý³Ì±ØÐëÒª±£Ö¤ÊÇÓÐÐòµÄ£¬´«ÊäÊý¾Ý²»ÄÜ³öÏÖÂÒÐòµÄÇé¿ö£¬·ñÔò½øÐÐMerge SortÊ±Êý¾Ý¾Í»á³öÎÊÌâ£¬²¢Ó°Ïì×îÖÕ½á¹û¡£

µÚÈý£¬Á¬½ÓµÄ¸´ÓÃºÍÍøÂçµÄÓÅ»¯£¬°üÀ¨ÉÏÏÂÓÎÔÚÍ¬Ò»¸ö½Úµã£¬¾¡¿ÉÄÜ×ßÄÚ´æ½»»»£¬¶ø²»×ßÍøÂç¡£ÕâÑù¿ÉÒÔ¼õÉÙÍøÂç¿ªÏúÒÔ¼°Êý¾ÝµÄÐòÁÐ»¯ºÍ·´ÐòÁÐ»¯µÄ´ú¼Û¡£´ËÍâ£¬ClickHouseÔÚ¼ÆËãÉÏ×öÁË·Ç³£³ä×ãµÄÓÅ»¯£¬Òò´ËÆäÔÚÄ³Ð©³¡¾°ÖÐ£¬ÄÚ´æ´ø¿í»á³ÉÎªÆ¿¾±£¬ÔÚExchangeManagerµÄÒ»Ð©³¡¾°ÖÐ£¬¿ÉÒÔÓÃÒ»Ð©Áã¿½±´ºÍÆäËûÓÅ»¯£¬¾¡Á¿¼õÉÙÄÚ´æµÄ¿½±´¡£

µÚËÄ£¬Òì³£´¦ÀíºÍ¼à¿Ø¡£Ïà±ÈÓÚµ¥»ú£¬·Ö²¼Ê½Çé¿öÏÂÒì³£Çé¿ö»á¸ü¼Ó¸´ÔÓ£¬ÇÒ¸ü¼ÓÄÑÒÔ¸ÐÖª¡£Í¨¹ýÖØÊÔÄÜ¹»±ÜÃâÒ»Ð©½Úµã¶ÌÊ±ÐÔµÄ¸ß¸ºÔØ»òÕßÒì³£¶Ô²éÑ¯µÄÓ°Ïì¡£×öºÃ¼à¿Ø£¬ÔÚ³öÎÊÌâµÄÊ±ºò£¬ÄÜ¿ìËÙ¸ÐÖª£¬²¢½øÐÐÅÅ²é£¬Ò²ÄÜ¹»Õë¶ÔÐÔµØÈ¥×öÓÅ»¯¡£

ÓÅ»¯ÓëÕï¶Ï?

Ê×ÏÈÊÇJoinµÄ¶àÖÖÊµÏÖºÍÓÅ»¯¡£¸ù¾ÝÊý¾ÝµÄ¹æÄ£ºÍ·Ö²¼£¬¿ÉÒÔ¸ù¾Ý²»Í¬µÄ³¡¾°È¥Ñ¡ÔñºÏÊÊµÄJoinµÄÊµÏÖ·½Ê½£º

Shuffle Join£¬ÊÇÄ¿Ç°Ê¹ÓÃ·½Ê½×î¶à£¬Ò²ÊÇ×î³£¼ûµÄ¡£
Broadcast Join£¬´ó±íJoinÐ¡±í³¡¾°£¬½«ÓÒ±í¹ã²¥µ½×ó±íµÄËùÓÐWorker½ÚµãÉÏÃæ£¬ÕâÑù¿ÉÒÔ±ÜÃâ×ó±í´ó±íµÄÊý¾Ý´«Êä¡£
Colocate Join£¬Èç¹û×óÓÒ±í¶¼ÒÑ°´ÕÕJoin key·Ö²¼£¬²¢ÇÒËüÃÇÊÇÏàÍ¨µÄ·Ö²¼µÄ»°£¬ÆäÊµ²»ÐèÒªÈ¥×öÊý¾ÝµÄexchange£¬¿ÉÒÔ½«Êý¾ÝµÄ´«Êä¼õµ½×îÐ¡¡£

ÍøÂçÁ¬½ÓµÄÓÅ»¯£¬ºËÐÄ±¾ÖÊÊÇ¼õÉÙÁ¬½ÓµÄ½¨Á¢ºÍÊ¹ÓÃ£¬ÌØ±ðÊÇÔÚÊý¾ÝÐèÒªShuffleÊ±£¬ÏÂÒ»ÂÖStageÖÐµÄÃ¿Ò»¸ö½Úµã¶¼Òª´ÓÉÏÓÎµÄStageÖÐµÄÃ¿¸ö½ÚµãÈ¥ÀÈ¡Êý¾Ý¡£Èô¼¯ÈºÕûÌåµÄ½ÚµãÊý½Ï¶à£¬ÇÒ´æÔÚºÜ¶à½Ï¸´ÔÓµÄQuery£¬¾Í»á½¨Á¢·Ç³£¶àµÄÁ¬½Ó¡£

Í¼Æ¬

Ä¿Ç°ÔÚ×Ö½ÚÄÚ²¿£¬ClickHouse¼¯ÈºµÄ¹æÄ£·Ç³£´ó£¬ÔÚµ±Ç° ClickHouse ¶þ½×¶ÎÖ´ÐÐµÄ¸ß²¢·¢Çé¿öÏÂ£¬µ¥»ú×î´ó¿ÉÄÜ»á½¨Á¢¼¸Íò¸öÁ¬½Ó¡£Òò´Ë±ØÐëÒª½øÐÐÍøÂçÁ¬½ÓµÄÓÅ»¯£¬ÌØ±ðÊÇÖ§³ÖÁ¬½ÓµÄ¸´ÓÃ£¬Ã¿¸öÁ¬½ÓÉÏ¿ÉÒÔÅÜ¶à¸öStage²éÑ¯¡£Í¨¹ý¾¡¿ÉÄÜÈ¥¸´ÓÃÁ¬½Ó£¬ÔÚ²»Í¬µÄ½ÚµãÖ®¼ä£¬ÄÜ¹»½¨Á¢¹Ì¶¨ÊýÄ¿µÄÁ¬½Ó£¬²»Í¬µÄQuery¡¢Stage¶¼»á¸´ÓÃÕâÐ©Á¬½Ó£¬Á¬½ÓÊý²¢²»»áËæ×ÅQueryºÍStageµÄ¹æÄ£µÄÔö³¤¶øÔö³¤¡£

ÍøÂç´«ÊäÓÅ»¯£¬ÔÚÊý¾ÝÖÐÐÄÄÚ£¬Ô¶³ÌµÄÖ±½ÓµÄÄÚ´æ·ÃÎÊ£¬Í¨³£Ö¸RDMA£¬ÊÇÒ»ÖÖÄÜ¹»³¬¹ýÔ¶³ÌÖ÷»ú²Ù×÷ÏµÍ³µÄÄÚºË£¬È¥·ÃÎÊÄÚ´æÀïµÄÊý¾ÝµÄ¼¼Êõ¡£ÓÉÓÚÕâÖÖ¼¼Êõ²»ÐèÒª¾¹ý²Ù×÷ÏµÍ³£¬ËùÒÔ²»½ö½ÚÊ¡ÁË´óÁ¿µÄCPU×ÊÔ´£¬Í¬ÑùÒ²ÌáÉýÁËÏµÍ³ÍÌÍÂÁ¿£¬½µµÍÁËÏµÍ³µÄÍøÂçÍ¨ÐÅÑÓ³Ù£¬ÓÈÆäÊÊºÏ´ó¹æÄ£²¢ÐÐµÄ¼ÆËã»ú¼¯Èº¡£ÓÉÓÚ ClickHouse ÔÚ¼ÆËã²ãÃæ×öÁËºÜ¶àÓÅ»¯£¬¶øÍøÂç´ø¿íÏà±ÈÓÚÄÚ´æ´ø¿íÒªÐ¡²»ÉÙ£¬ÔÚÒ»Ð©Êý¾ÝÁ¿´«ÊäÌØ±ð´óµÄ³¡¾°£¬ÍøÂç´«Êä»á³ÉÎªÒ»¶¨µÄÆ¿¾±¡£ÎªÁËÌáÉýÍøÂç´«ÊäµÄÐ§ÂÊºÍÌáÉýÊý¾Ý exchange µÄÍÌÍÂ£¬Ò»·½Ãæ¿ÉÒÔÒýÈëÑ¹ËõÀ´½µµÍ´«ÊäÊý¾ÝÁ¿£¬ÁíÒ»·½Ãæ¿ÉÒÔÒýÈë RDMA À´¼õÉÙÒ»¶¨µÄ¿ªÏú¡£¾¹ý²âÊÔ£¬ÔÚÒ»Ð©Êý¾Ý´«ÊäÁ¿´óµÄ³¡¾°£¬ÓÐ²»Ð¡µÄÊÕÒæ¡£

ÀûÓÃRuntime FilterµÄÓÅ»¯ÔÚ²»ÉÙÊý¾Ý¿âÒ²ÓÐÊ¹ÓÃ¡£JoinµÄËã×ÓÍ¨³£ÊÇOLAPÒýÇæÀï×îºÄÊ±µÄËã×Ó£¬ÓÅ»¯JoinËã×ÓÓÐÁ½ÖÖË¼Â·¡£Ò»ÖÖË¼Â·ÊÇ¿ÉÒÔÌáÉýJoinËã×ÓµÄÐÔÄÜ¡£±ÈÈç¶ÔÓÚ HashJoin£¬¿ÉÒÔÓÅ»¯ HashTable ÊµÏÖ£¬Ò²¿ÉÒÔÊµÏÖ¸üºÃµÄ¹þÏ£Ëã·¨£¬°üÀ¨×öÒ»Ð©¸üºÃµÄ²¢ÐÐµÄ·½Ê½¡£

Í¼Æ¬

ÁíÒ»ÖÖË¼Â·ÊÇ£¬Èç¹û±¾ÉíËã×ÓºÄÊ±±È½ÏÖØ£¬¿ÉÒÔ¼õÉÙ²ÎÓëËã×Ó¼ÆËãµÄÊý¾Ý¡£Runtime FilterÊÇÔÚÒ»Ð©³¡¾°ÏÂÌØ±ðÊÇÊÂÊµ±íJoin¶àÕÅÎ¬¶È±íµÄÐÇÐÍÄ£ÐÍ³¡¾°ÓÐ±È½ÏºÃµÄÐ§¹û¡£ÔÚ´ËÀà³¡¾°ÏÂ£¬Í¨³£ÊÂÊµ±íµÄ¹æÄ£»á·Ç³£´ó£¬¶ø´ó²¿·ÖµÄ¹ýÂËÌõ¼þ¶¼ÊÇÔÚÎ¬¶È±íÉÏÃæ¡£

Runtime FilterµÄ×÷ÓÃ£¬ÊÇÍ¨¹ýÔÚJoinµÄProbe¶Ë£¬ÌáÇ°¹ýÂËµô²¢²»»áÃüÖÐJoinÌõ¼þµÄÊäÈëÊý¾Ý£¬´Ó¶ø´ó·ù¼õÉÙJoinÖÐµÄÊý¾Ý´«ÊäºÍ¼ÆËã¡£Í¨¹ýÕâÖÖ·½Ê½£¬ÄÜ¹»¼õÉÙÕûÌåµÄÖ´ÐÐÊ±¼ä¡£Òò´ËÎÒÃÇÔÚ¸´ÔÓ²éÑ¯ÉÏÒ²Ö§³ÖÁËRuntime Filter£¬Ä¿Ç°Ö÷ÒªÖ§³ÖMin MaxºÍBloom Filter¡£

Èç¹û runtime filter µÄÁÐ£¨join column£©¹¹½¨ÁËË÷Òý£¨Ö÷¼ü¡¢skip index¡£©£¬ÊÇÐèÒªÖØÐÂÉú³É pipeline µÄ¡£ÒòÎªÃüÖÐË÷Òýºó£¬¿ÉÄÜ»á¼õÉÙÊý¾ÝµÄ¶ÁÈ¡£¬pipeline ²¢ÐÐ¶ÈºÍ¶ÔÓ¦Êý¾ÝµÄ´¦Àí range ¶¼¿ÉÄÜ·¢Éú±ä»¯¡£Èç¹û runtime filter µÄÁÐ¸úË÷ÒýÎÞ¹Ø£¬¿ÉÒÔÔÚ¼Æ»®Éú³ÉµÄÊ±ºòÔ¤ÏÈ´øÉÏ¹ýÂËÌõ¼þ£¬Ò»¿ªÊ¼Îª¿Õ£¬Ö»ÊÇÕ¼Î»£¬runtime filter ÏÂ·¢µÄÊ±ºò°ÑÕ¼Î»ÐÅÏ¢¸Ä³ÉÕæÕýµÄ¹ýÂËÌõ¼þ¼´¿É¡£ÕâÑù¼´Ê¹ runtime filter ÏÂ·¢³¬Ê±ÁË£¬²éÑ¯Æ¬¶ÎÒÑ¾¿ªÊ¼Ö´ÐÐ£¬Ö»Òª²éÑ¯Æ¬¶ÎÃ»ÓÐÖ´ÐÐÍê£¬Ö®ºóµÄÊý¾ÝÈÔÈ»¿ÉÒÔ½øÐÐ¹ýÂË¡£

µ«ÐèÒª×¢ÒâµÄÊÇ£¬Runtime FilterÊÇÒ»ÖÖÌØÊâ³¡¾°ÏÂµÄÓÅ»¯£¬Õë¶Ô³¡¾°ÊÇÓÒ±íÊý¾ÝÁ¿²»´ó£¬²¢ÇÒ¹¹½¨µÄRuntime Filter¶Ô×ó±íÓÐ±È½ÏºÃµÄ¹ýÂËÐ§¹û¡£ÈôÓÒ±íÊý¾ÝÁ¿½Ï´ó£¬¹¹½¨µÄRuntime FilterµÄÊ±¼ä±È½Ï¾Ã£¬»ò¶Ô×ó±íµÄÊý¾Ý¹ýÂËÃ»ÓÐÐ§¹û¡£Runtime Filter·´¶ø»áÔö¼Ó²éÑ¯µÄºÄÊ±ºÍ¼ÆËãµÄ¿ªÏú¡£Òò´ËÒª¸ù¾ÝÊý¾ÝµÄÌØÕ÷ºÍ¹æÄ£À´¾ö¶¨ÊÇ·ñ¿ªÆôÓÅ»¯¡£

ÐÔÄÜÕï¶ÏºÍ·ÖÎö¶Ô¸´ÔÓ²éÑ¯ºÜ¹Ø¼ü£¬ÓÉÓÚÒýÈëÁË¸´ÔÓ²éÑ¯µÄ¶àStageÄ£ÐÍ£¬SQLÖ´ÐÐµÄÄ£Ê½»á±äµÃ¸´ÔÓ¡£¶Ô´ËµÄÓÅ»¯Ê×ÏÈÊÇ¾¡¿ÉÄÜÍêÉÆ¸÷ÀàMetrics£¬°üÀ¨QueryÖ´ÐÐÊ±¼ä¡¢²»Í¬StageÖ´ÐÐÊ±¼ä¡¢ÆðÊ¼Ê±¼ä¡¢½áÊøÊ±¼ä¡¢´¦ÀíµÄIOÊý¾ÝÁ¿¡¢Ëã×Ó´¦ÀíµÄÊý¾Ý¡¢Ö´ÐÐÇé¿ö£¬ÒÔ¼°¸÷ÀàµÄËã×ÓMetricsºÍÒ»Ð©Profile Events£¨ÀýÈçRuntime Filter»áÓÐ¹¹½¨Ê±¼ä¡¢¹ýÂËÊý¾ÝÁ¿µÈMetrics£©¡£

Æä´Î£¬ÎÒÃÇ¼ÇÂ¼ÁË·´Ñ¹ÐÅÏ¢ÓëÉÏÏÂÓÎµÄ¶ÓÁÐ³¤¶È£¬ÒÔ´ËÍÆ¶ÏStageµÄÖ´ÐÐÇé¿öºÍÆ¿¾±¡£

Í¨³£¿ÉÒÔÓÐÈçÏÂÅÐ¶Ï£º

ÊäÈëºÍÊä³ö¶ÓÁÐÊýÄ¿Í¬ÎªµÍ»òÍ¬Îª¸ß·Ö±ð±íÃ÷µ±Ç° stage ´¦ÀíÕý³£»ò´¦ÓÚ±»ÏÂÓÎ·´Ñ¹£¬´ËÊ±¿ÉÒÔÍ¨¹ý·´Ñ¹ÐÅÏ¢À´½øÒ»²½ÅÐ¶Ï
µ±ÊäÈëºÍÊä³ö¶ÓÁÐÊýÄ¿²»Ò»Ñù£¬Õâ¿ÉÄÜÊÇ³öÓÚ·´Ñ¹´«µ¼µÄÖÐ¼ä×´Ì¬»òÕß¸Ã stage ¾ÍÊÇ·´Ñ¹µÄ¸ùÔ´
Èç¹ûÒ»¸ö stage µÄÊä³ö¶ÓÁÐÊýÄ¿ºÜ¶à£¬ÇÒ¾³£±»·´Ñ¹£¬Í¨³£ÊÇ±»ÏÂÓÎ stage ËùÓ°Ïì£¬ËùÒÔ¿ÉÒÔÅÅ³ýËü±¾ÉíÊÇ·´Ñ¹¸ùÔ´µÄ¿ÉÄÜÐÔ£¬¸ü¶à¹Ø×¢ËüµÄÏÂÓÎ
Èç¹ûÒ»¸ö stage µÄÊä³ö¶ÓÁÐÊýÄ¿ºÜÉÙ£¬µ«ÆäÊäÈë¶ÓÁÐµÄÊýÄ¿ºÜ¸ß£¬Ôò±íÃ÷ËüÓÐ¿ÉÄÜÊÇ·´Ñ¹µÄ¸ùÔ´¡£ÓÅ»¯Ä¿±êÊÇÌáÉýÕâ¸ö stage µÄ´¦ÀíÄÜÁ¦

×ÜµÄÀ´Ëµ£¬SQLµÄ³¡¾°°üÂÞÍòÏó£¬·Ç³£¸´ÔÓµÄ³¡¾°ÓÐÊ±»¹ÊÇÐèÒª¶ÔÒýÇæÓÐÒ»¶¨ÁË½âµÄÍ¬Ñ§È¥Õï¶ÏºÍ·ÖÎö£¬¸ø³öÓÅ»¯½¨Òé¡£×Ö½ÚÄ¿Ç°Ò²ÔÚ²»¶ÏÍêÉÆÕâÐ©¾Ñé£¬Ï£ÍûÄÜ¹»Í¨¹ý²»¶ÏÍêÉÆMetricsºÍ·ÖÎöµÄÂ·¾¶£¬³ÖÐø¼õÇáOncallµÄ¸ºµ££¬ÔÚÄ³Ð©³¡¾°ÏÂÄÜ¹»¸ü¼Ó×¼È·µØ¸ø³öÓÅ»¯½¨Òé¡£

Ð§¹ûÓëÕ¹Íû?

¸ù¾ÝÉÏÊöËùÌá£¬Ä¿Ç°Ö´ÐÐÄ£ÐÍ´æÔÚÈý¸öÈ±µã£¬ÎÒÃÇ½øÐÐÁË¸´ÔÓ²éÑ¯µÄÓÅ»¯£¬Òò´ËÐèÒªÑéÖ¤ÕâÖÖÐÂµÄÄ£Ê½ÊÇ·ñÄÜ¹»½â¾ö·¢ÏÖµÄÎÊÌâ£¬²âÊÔ³¡¾°ÈçÏÂ£º

µÚ¶þ½×¶Î¼ÆËã½Ï¸´ÔÓ£¬ÇÒµÚÒ»½×¶ÎÊý¾Ý½Ï¶à
Hash JoinÓÒ±íÊÇ´ó±í
¶à±íJoin£¬Ä£Äâ¸´ÔÓQuery
ÒÔSSB 1TÊý¾Ý×÷ÎªÊý¾Ý¼¯£¬»·¾³ÔòÊÇ¹¹½¨ÁË8¸ö½ÚµãµÄ¼¯Èº

Case1¡ª¡ª¶þ½×¶Î¼ÆËã¸´ÔÓ¡£ÎÒÃÇ¿´µ½ÓÐÒ»¸ö±È½ÏÖØµÄ¼ÆËãËã×ÓUniqExact£¬¾ÍÊÇcount distinctµÄ¼ÆËã·½Ê½£¬Í¨¹ýHash±í×öÈ¥ÖØ¡£count distinctÄ¬ÈÏ²ÉÓÃÕâÖÖËã·¨£¬µ±ÎÒÃÇÊ¹ÓÃ¸´ÔÓ²éÑ¯ºó£¬QueryµÄÖ´ÐÐÊ±¼ä´Ó8.5Ãë¼õÉÙµ½2.198Ãë¡£µÚ¶þ½×¶Î agg uniqExact Ëã×ÓµÄºÏ²¢Ô±¾ÓÉcoordinatorµ¥µãºÏ²¢£¬ÏÖÔÚÍ¨¹ý°´ÕÕgroup by key shuffleºó¿ÉÒÔÓÉ¶à¸ö½Úµã²¢ÐÐÍê³É¡£Òò´ËÍ¨¹ýshuffle¼õÇáÁËcoordinatorµÄ merge agg Ñ¹Á¦¡£

Í¼Æ¬

Case2¡ª¡ªÓÒ±íÎª´ó±í¡£ÓÉÓÚ ClickHouse ¶Ô¶à±íµÄÓÅ»¯×öµÄ»¹²»ÊÇºÜµ½Î»¡£ÕâÀï²ÉÓÃ×Ó²éÑ¯À´ÏÂÍÆ¹ýÂËµÄÌõ¼þ¡£ÔÚÕâ¸öcaseÖÐ£¬LineorderÊÇÒ»ÕÅ´ó±í£¬²ÉÓÃ¸´ÔÓ²éÑ¯µÄÄ£Ê½ÒÔºó£¬QueryÖ´ÐÐÊ±¼ä´Ó17ÃëÓÅ»¯µ½ÁË1.7Ãë¡£ÓÉÓÚLineorderÊÇÒ»ÕÅ´ó±í£¬Í¨¹ýShuffle¿ÉÒÔ½«Êý¾Ý°´ÕÕJoin key Shuffleµ½¸÷Worker½ÚµãÉÏ£¬ÕâÑù¾Í¼õÉÙÁËÓÒ±í¹¹½¨µÄÑ¹Á¦¡£

Í¼Æ¬

Case3¡ª¡ª¶à±íJoin¡£¿ªÆô¸´ÔÓ²éÑ¯ºó£¬QueryµÄÖ´ÐÐÊ±¼ä´Ó8.58ÃëÓÅ»¯µ½4.464Ãë£¬ËùÓÐµÄÓÒ±í¶¼¿ÉÒÔÍ¬Ê±¿ªÊ¼Êý¾ÝµÄ´¦ÀíºÍ¹¹½¨¡£ÎªÁËºÍÏÖÓÐÄ£Ê½×ö¶Ô±È£¬¸´ÔÓ²éÑ¯ÕâÀï²¢Ã»ÓÐ¿ªÆô runtime filter£¬¿ªÆô runtime filter ºóÐ§¹û»á¸üºÃ¡£

Í¼Æ¬

ÊÂÊµÉÏ£¬ÓÅ»¯Æ÷¶Ô¸´ÔÓ²éÑ¯µÄÐÔÄÜÌáÉýÒ²·Ç³£´ó£¬Í¨¹ýÒ»Ð©RBOµÄ¹æÔò£¬ÀýÈç³£¼ûµÄÎ½´ÊÏÂÍÆ¡¢Ïà¹Ø×Ó²éÑ¯µÄ´¦ÀíµÈ£¬¿ÉÒÔ¼«´óÌáÉýSQLµÄÖ´ÐÐÐ§ÂÊ¡£ÔÚ¸´ÔÓ²éÑ¯µÄÄ£Ê½ÏÂ£¬ÓÉÓÚÓÐÓÅ»¯Æ÷µÄ´æÔÚ£¬ÓÃ»§ÉõÖÁ²»ÐèÒªÐ´µÃ·Ç³£¸´ÔÓ£¬ÓÅ»¯Æ÷×Ô¶¯È¥Íê³ÉÕâÐ©ÏÂÍÆºÍRBO¹æÔòÓÅ»¯¡£

´ËÍâ£¬Ñ¡ÔñÓÃÄÄÒ»ÖÖJoinµÄÊµÏÖ£¬Ò²»á¶ÔJoinµÄÐÔÄÜÓ°Ïì½Ï´ó¡£ÈôÄÜ¹»Âú×ãJoin Key·Ö²¼£¬Ê¹ÓÃColocate Join¿ÉÒÔ¼õÉÙ×óÓÒ±íShuffleµÄ´«Êä´ú¼Û¡£ÔÚ¶à±íJoinµÄÇé¿öÏÂ£¬JoinµÄË³ÐòºÍJoinµÄÊµÏÖ·½Ê½¶ÔÖ´ÐÐµÄÊ±³¤Ó°Ïì£¬»á±ÈÁ½±íJoin¸ü´ó¡£½èÖúÕâÖÖÊý¾ÝµÄÍ³¼ÆÐÅÏ¢£¬Í¨¹ýÒ»Ð©CBOµÄÓÅ»¯£¬¿ÉÒÔµÃµ½Ò»¸ö±È½ÏºÃµÄÖ´ÐÐÄ£Ê½¡£

ÓÐÁËÓÅ»¯Æ÷£¬ÒµÎñÍ¬Ñ§¿ÉÒÔ°´ÕÕÒµÎñÂß¼À´Ð´ÈÎºÎµÄ SQL£¬ÒýÇæ×Ô¶¯¼ÆËã³öÏà¶Ô×îÓÅµÄ SQL ¼Æ»®²¢Ö´ÐÐ£¬¼ÓËÙ²éÑ¯µÄÖ´ÐÐ¡£

×Ü½áÒ»ÏÂ£¬ClickHouseÄ¿Ç°µÄÖ´ÐÐÄ£Ê½ÔÚºÜ¶àµ¥±íµÄ³¡¾°ÏÂ±íÏÖ·Ç³£ÓÅÒì£¬ÎÒÃÇÖ÷ÒªÕë¶Ô¸´ÔÓ³¡¾°×öÓÅ»¯£¬Í¨¹ýÊµÏÖ¶àStageµÄÄ£Ê½£¬ÊµÏÖÁËStageÖ®¼äµÄÊý¾ÝµÄ´«Êä£¬´Ó¹¤³ÌÊµ¼ùÉÏ×öÁË½Ï¶à³¢ÊÔºÍÓÅ»¯£¬È¥ÌáÉýÖ´ÐÐºÍÍøÂç´«ÊäµÄÐÔÄÜ¡£²¢Ï£ÍûÍ¨¹ýÍêÉÆMetricsºÍÖÇÄÜÕï¶ÏÀ´½µµÍSQL·ÖÎöºÍµ÷ÓÅµÄÃÅ¼÷¡£Ä¿Ç°ÒÑ¾ÊµÏÖÁËµÚÒ»²½£¬Î´À´×Ö½ÚÈÔÓÐºÜ¶àÅ¬Á¦µÄ·½Ïò¡£

Ê×ÏÈ£¬ÊÇÒª¼ÌÐøÈ¥ÌáÉýÖ´ÐÐºÍExchangeµÄÐÔÄÜ¡£ÕâÀï²»Ì¸ÂÛÒýÇæÖ´ÐÐÍ¨ÓÃµÄÓÅ»¯£¬±ÈÈç¸üºÃµÄË÷Òý»òÕßËã×ÓµÄÓÅ»¯£¬Ö÷ÒªÊÇ¸ú¸´ÔÓ²éÑ¯Ä£Ê½ÓÐ¹Ø¡£¾ÙÒ»¸öÀý×Ó£¬±ÈÈç Stage ¸´ÓÃ£¬ÔÚ SQL ³öÏÖ×Ó²éÑ¯½á¹û±»·´¸´Ê¹ÓÃµÄ³¡¾°£¬±ÈÈçÒ»Ð©¶à±í join ºÍ CTE ³¡¾°¿ÉÄÜÓÐ°ïÖú¡£Í¨¹ý Stage ¸´ÓÃ¿ÉÒÔ¼õÉÙÏàÍ¬Êý¾ÝµÄ¶à´Î¶ÁÈ¡¡£Stage ¸´ÓÃÎÒÃÇÖ®Ç°¾ÍÒÑ¾Ö§³Ö£¬µ«ÊÇÓÃµÄ³¡¾°±È½ÏÉÙ£¬Î´À´×¼±¸¸üÁé»îºÍÍ¨ÓÃ¡£

Æä´Î£¬MetricsºÍÖÇÄÜÕï¶Ï¼ÓÇ¿¡£SQLµÄÁé»î¶ÈºÜ¸ß£¬Òò´ËÒ»Ð©¸´ÔÓ²éÑ¯Èç¹ûÃ»ÓÐMetricsÆäÊµ¼¸ºõºÜÄÑÈ¥×öÕï¶ÏºÍµ÷ÓÅ¡£ÒÔÉÏ¶¼ÊÇ×Ö½ÚÌø¶¯Êý¾ÝÆ½Ì¨ÔÚÎ´À´»á³¤ÆÚµÄ³ÖÐøÈ¥·¢Á¦µÄ·½Ïò¡£

¼Î±ö½éÉÜ

¶Ò»·å£¬×Ö½ÚÌø¶¯Êý¾ÝÆ½Ì¨×ÊÉîÑÐ·¢¹¤³ÌÊ¦¡£¸ºÔð×Ö½ÚÌø¶¯ÆóÒµ¼¶ÊµÑéÆ½Ì¨ÍÅ¶Ó£¬ÖÂÁ¦ÓÚ´òÔìÒµ½ç×îÏÈ½øºÃÓÃµÄÊµÑéÆ½Ì¨£¬°ÑA/B²âÊÔ±ä³ÉÇý¶¯ÒµÎñÔö³¤µÄÐÂ»ù½¨¡£´Ó0µ½1²ÎÓë´î½¨ÁË×Ö½ÚÄÚÊµÑéÖÐÌ¨Libra£¬·þÎñÓÚ¶¶Òô¡¢Tiktok¡¢½ñÈÕÍ·ÌõµÈ500¶à¸öÒµÎñÏß£»¶ÔÍâ·¢²¼»ðÉ½ÒýÇæA/B²âÊÔ(aka DataTester)¡¢BytePlus OptimizeµÈ²úÆ·¡£

×Ö½ÚÌø¶¯Êý¾ÝÆ½Ì¨¼¼Êõ½ÒÃØ£º»ùÓÚClickHouseµÄ¸´ÔÓ²éÑ¯ÊµÏÖÓëÓÅ»¯ Ô´´ ¾«Ñ¡

ÏîÄ¿±³¾°?

¼¼Êõ·½°¸?

ÓÅ»¯ÓëÕï¶Ï?

Ð§¹ûÓëÕ¹Íû?

¼Î±ö½éÉÜ

Ïà¹ØÎÄÕÂ

ÓÃ»§ÆÀÂÛ

·¢±íÆÀÂÛ

×îÐÂÄÚÈÝ