diff --git a/docs/zh_cn/tutorials/metric_and_evaluator.md b/docs/zh_cn/design/metric_and_evaluator.md
similarity index 85%
rename from docs/zh_cn/tutorials/metric_and_evaluator.md
rename to docs/zh_cn/design/metric_and_evaluator.md
index 7cf962ebe92bdf263b95173d54d89553a7a248ff..79aa24b40dcf5f66beca3878f8ff13a56f74f748 100644
--- a/docs/zh_cn/tutorials/metric_and_evaluator.md
+++ b/docs/zh_cn/design/metric_and_evaluator.md
@@ -5,38 +5,18 @@
 **è¯„æµ‹æŒ‡æ ‡** æ ¹æ®æ¨¡åž‹çš„è¾“å…¥æ•°æ®å’Œé¢„æµ‹ç»“æžœï¼Œå®Œæˆç‰¹å®šæŒ‡æ ‡ä¸‹æ¨¡åž‹ç²¾åº¦çš„è®¡ç®—ã€‚è¯„æµ‹æŒ‡æ ‡ä¸Žæ•°æ®é›†ä¹‹é—´ç›¸äº’è§£è€¦ï¼Œè¿™ä½¿å¾—ç”¨æˆ·å¯ä»¥ä»»æ„ç»„åˆæ‰€éœ€çš„æµ‹è¯•æ•°æ®å’Œè¯„æµ‹æŒ‡æ ‡ã€‚å¦‚ [COCOMetric](Todo:coco-metric-doc-link) å¯ç”¨äºŽè®¡ç®— COCO æ•°æ®é›†çš„ APï¼ŒAR ç‰è¯„æµ‹æŒ‡æ ‡ï¼Œä¹Ÿå¯ç”¨äºŽå…¶ä»–çš„ç›®æ ‡æ£€æµ‹æ•°æ®é›†ä¸Šã€‚
 **è¯„æµ‹å™¨** æ˜¯è¯„æµ‹æŒ‡æ ‡çš„ä¸Šå±‚æ¨¡å—ï¼Œé€šå¸¸åŒ…å«ä¸€ä¸ªæˆ–å¤šä¸ªè¯„æµ‹æŒ‡æ ‡ã€‚è¯„æµ‹å™¨çš„ä½œç”¨æ˜¯åœ¨æ¨¡åž‹è¯„æµ‹æ—¶å®Œæˆå¿…è¦çš„æ•°æ®æ ¼å¼è½¬æ¢ï¼Œå¹¶è°ƒç”¨è¯„æµ‹æŒ‡æ ‡è®¡ç®—æ¨¡åž‹ç²¾åº¦ã€‚è¯„æµ‹å™¨é€šå¸¸ç”±[æ‰§è¡Œå™¨](TODO:runner-doc-link)æˆ–æµ‹è¯•è„šæœ¬æž„å»ºï¼Œåˆ†åˆ«ç”¨äºŽåœ¨çº¿è¯„æµ‹å’Œç¦»çº¿è¯„æµ‹ã€‚
 
-ç”¨æˆ·é€šå¸¸ä¸éœ€è¦æ·±å…¥äº†è§£æˆ–æ‰‹åŠ¨ä¿®æ”¹è¯„æµ‹å™¨ï¼Œå› æ¤è¯¥æ–‡æ¡£å°†é‡ç‚¹ä»‹ç»è¯„æµ‹æŒ‡æ ‡çš„åŽŸç†å’Œä½¿ç”¨æ–¹å¼ã€‚
-
-## æ¨¡åž‹ç²¾åº¦è¯„æµ‹
+## æ¨¡åž‹ç²¾åº¦è¯„æµ‹æµç¨‹
 
 é€šå¸¸ï¼Œæ¨¡åž‹ç²¾åº¦è¯„æµ‹çš„è¿‡ç¨‹å¦‚ä¸‹å›¾æ‰€ç¤ºã€‚
 
 **åœ¨çº¿è¯„æµ‹**ï¼šæµ‹è¯•æ•°æ®é€šå¸¸ä¼šè¢«åˆ’åˆ†ä¸ºè‹¥å¹²æ‰¹æ¬¡ï¼ˆbatchï¼‰ã€‚é€šè¿‡ä¸€ä¸ªå¾ªçŽ¯ï¼Œä¾æ¬¡å°†æ¯ä¸ªæ‰¹æ¬¡çš„æ•°æ®é€å…¥æ¨¡åž‹ï¼Œå¾—åˆ°å¯¹åº”çš„é¢„æµ‹ç»“æžœï¼Œå¹¶å°†æµ‹è¯•æ•°æ®å’Œæ¨¡åž‹é¢„æµ‹ç»“æžœé€å…¥è¯„æµ‹å™¨ã€‚è¯„æµ‹å™¨ä¼šè°ƒç”¨è¯„æµ‹æŒ‡æ ‡çš„ `process()` æ–¹æ³•å¯¹æ•°æ®å’Œé¢„æµ‹ç»“æžœè¿›è¡Œå¤„ç†ã€‚å½“å¾ªçŽ¯ç»“æŸåŽï¼Œè¯„æµ‹å™¨ä¼šè°ƒç”¨è¯„æµ‹æŒ‡æ ‡çš„ `evaluate()` æ–¹æ³•ï¼Œå¯è®¡ç®—å¾—åˆ°å¯¹åº”æŒ‡æ ‡çš„æ¨¡åž‹ç²¾åº¦ã€‚
 
-**ç¦»çº¿è¯„æµ‹**ï¼šä¸Žåœ¨çº¿è¯„æµ‹è¿‡ç¨‹ç±»ä¼¼ï¼ŒåŒºåˆ«æ˜¯ç›´æŽ¥è¯»å–é¢„å…ˆä¿å˜çš„æ¨¡åž‹é¢„æµ‹ç»“æžœæ¥è¿›è¡Œè¯„æµ‹ã€‚è¯„æµ‹å™¨æä¾›äº† `offline_evaluate` æŽ¥å£ï¼Œç”¨äºŽåœ¨ç¦»çº¿æ–¹å¼ä¸‹è°ƒç”¨è¯„æµ‹æŒ‡æ ‡æ¥è®¡ç®—æ¨¡åž‹ç²¾åº¦ã€‚ä¸ºäº†é¿å…åŒæ—¶å¤„ç†å¤§é‡æ•°æ®å¯¼è‡´å†…å˜æº¢å‡ºï¼Œç¦»çº¿è¯„æµ‹æ—¶ä¼šå°†æµ‹è¯•æ•°æ®å’Œé¢„æµ‹ç»“æžœåˆ†æˆè‹¥å¹²ä¸ªå—ï¼ˆChunkï¼‰è¿›è¡Œå¤„ç†ï¼Œç±»ä¼¼åœ¨çº¿è¯„æµ‹ä¸çš„æ‰¹æ¬¡ã€‚
+**ç¦»çº¿è¯„æµ‹**ï¼šä¸Žåœ¨çº¿è¯„æµ‹è¿‡ç¨‹ç±»ä¼¼ï¼ŒåŒºåˆ«æ˜¯ç›´æŽ¥è¯»å–é¢„å…ˆä¿å˜çš„æ¨¡åž‹é¢„æµ‹ç»“æžœæ¥è¿›è¡Œè¯„æµ‹ã€‚è¯„æµ‹å™¨æä¾›äº† `offline_evaluate` æŽ¥å£ï¼Œç”¨äºŽåœ¨ç¦»çº¿æ–¹å¼ä¸‹è°ƒç”¨è¯„æµ‹æŒ‡æ ‡æ¥è®¡ç®—æ¨¡åž‹ç²¾åº¦ã€‚ä¸ºäº†é¿å…åŒæ—¶å¤„ç†å¤§é‡æ•°æ®å¯¼è‡´å†…å˜æº¢å‡ºï¼Œç¦»çº¿è¯„æµ‹æ—¶ä¼šå°†æµ‹è¯•æ•°æ®å’Œé¢„æµ‹ç»“æžœåˆ†æˆè‹¥å¹²ä¸ªå—ï¼ˆchunkï¼‰è¿›è¡Œå¤„ç†ï¼Œç±»ä¼¼åœ¨çº¿è¯„æµ‹ä¸çš„æ‰¹æ¬¡ã€‚
 
 <div align="center">
     <img src="https://user-images.githubusercontent.com/15977946/163718224-20a4970a-e540-4a3a-8b01-bf0a604c6841.jpg" width="500"/>
 </div>
 
-## åœ¨é…ç½®æ–‡ä»¶ä¸é…ç½®è¯„æµ‹æŒ‡æ ‡
-
-åœ¨é…ç½®æ–‡ä»¶ä¸å¯ä»¥é€šè¿‡ `val_evaluator` å’Œ `test_evaluator` 2 ä¸ªå—æ®µåˆ†åˆ«æŒ‡å®šæ¨¡åž‹éªŒè¯å’Œæµ‹è¯•é˜¶æ®µçš„è¯„æµ‹æŒ‡æ ‡ã€‚ä¾‹å¦‚ï¼Œç”¨æˆ·åœ¨è®ç»ƒåˆ†ç±»æ¨¡åž‹æ—¶ï¼Œå¸Œæœ›åœ¨æ¨¡åž‹éªŒè¯é˜¶æ®µä½¿ç”¨åˆ†ç±»æ£ç¡®çŽ‡å’Œ F1 Score ä¸¤ä¸ªè¯„æµ‹æŒ‡æ ‡ï¼Œå¯ä»¥æŒ‰ä»¥ä¸‹æ–¹å¼é…ç½®ï¼š
-
-```python
-val_evaluator = [
-    dict(type='Accuracy', top_k=1),  # ä½¿ç”¨åˆ†ç±»æ£ç¡®çŽ‡è¯„æµ‹æŒ‡æ ‡
-    dict(type='F1Score')  # ä½¿ç”¨ F1_score è¯„æµ‹æŒ‡æ ‡
-]
-```
-
-é…ç½®ä¸çš„`val_evaluator` ä¼šè¢«ç”¨äºŽæž„å»ºä¸€ä¸ªåŒ…å«å¤šä¸ªè¯„æµ‹æŒ‡æ ‡çš„è¯„æµ‹å™¨ï¼Œå…¶ä¸çš„æ¯ä¸ªå—å…¸å¯¹åº”äºŽä¸€ä¸ªè¯„æµ‹æŒ‡æ ‡çš„ç±»åˆ«å’Œå‚æ•°ã€‚
-å¦‚æžœåªä½¿ç”¨å•ä¸ªè¯„æµ‹æŒ‡æ ‡ï¼Œä¹Ÿå¯ä»¥çœç•¥æŽ‰é…ç½®ä¸çš„åˆ—è¡¨ï¼Œç›´æŽ¥æŒ‡å®šè¯„æµ‹æŒ‡æ ‡å‚æ•°ã€‚ä¾‹å¦‚ï¼Œåœ¨æ¨¡åž‹æµ‹è¯•é˜¶æ®µä½¿ç”¨åˆ†ç±»æ£ç¡®çŽ‡è¯„æµ‹æŒ‡æ ‡ï¼Œå¯¹åº”çš„é…ç½®å¦‚ä¸‹ï¼š
-
-```python
-test_evaluator = dict(type='Accuracy', top_k=1)
-```
-
 ## å¢žåŠ è‡ªå®šä¹‰è¯„æµ‹æŒ‡æ ‡
 
 åœ¨ OpenMMLab çš„å„ä¸ªç®—æ³•åº“ä¸ï¼Œå·²ç»å®žçŽ°äº†å¯¹åº”æ–¹å‘çš„å¸¸ç”¨è¯„æµ‹æŒ‡æ ‡ã€‚å¦‚ MMDetection ä¸æä¾›äº† COCO è¯„æµ‹æŒ‡æ ‡ï¼ŒMMClassification ä¸æä¾›äº† Accuracyã€F1Score ç‰è¯„æµ‹æŒ‡æ ‡ç‰ã€‚
diff --git a/docs/zh_cn/tutorials/evaluation.md b/docs/zh_cn/tutorials/evaluation.md
new file mode 100644
index 0000000000000000000000000000000000000000..01480584d690bf1eb83c91374f1762c2ce6a5eee
--- /dev/null
+++ b/docs/zh_cn/tutorials/evaluation.md
@@ -0,0 +1,64 @@
+# æ¨¡åž‹ç²¾åº¦è¯„æµ‹
+
+åœ¨æ¨¡åž‹éªŒè¯å’Œæ¨¡åž‹æµ‹è¯•ä¸ï¼Œé€šå¸¸éœ€è¦å¯¹æ¨¡åž‹ç²¾åº¦åšå®šé‡è¯„æµ‹ã€‚åœ¨ MMEngine ä¸å®žçŽ°äº†è¯„æµ‹æŒ‡æ ‡ï¼ˆMetricï¼‰å’Œè¯„æµ‹å™¨ï¼ˆEvaluatorï¼‰æ¨¡å—æ¥å®Œæˆè¿™ä¸€åŠŸèƒ½ï¼š
+
+- è¯„æµ‹æŒ‡æ ‡ï¼š ç”¨äºŽæ ¹æ®æµ‹è¯•æ•°æ®å’Œæ¨¡åž‹é¢„æµ‹ç»“æžœï¼Œå®Œæˆæ¨¡åž‹ç‰¹å®šç²¾åº¦æŒ‡æ ‡çš„è®¡ç®—ã€‚åœ¨ OpenMMLab å„ç®—æ³•åº“ä¸æä¾›äº†å¯¹åº”ä»»åŠ¡çš„å¸¸ç”¨è¯„æµ‹æŒ‡æ ‡ï¼Œå¦‚ [MMClassification](https://github.com/open-mmlab/mmclassification) ä¸æä¾›äº†[åˆ†ç±»æ£ç¡®çŽ‡æŒ‡æ ‡ï¼ˆAccuracyï¼‰](https://mmclassification.readthedocs.io/zh_CN/dev-1.x/generated/mmcls.evaluation.Accuracy.html) ç”¨äºŽè®¡ç®—åˆ†ç±»æ¨¡åž‹çš„ Top-k åˆ†ç±»æ£ç¡®çŽ‡ã€‚
+
+- è¯„æµ‹å™¨ï¼š æ˜¯è¯„æµ‹æŒ‡æ ‡çš„ä¸Šå±‚æ¨¡å—ï¼Œç”¨äºŽåœ¨æ•°æ®è¾“å…¥è¯„æµ‹æŒ‡æ ‡å‰å®Œæˆå¿…è¦çš„æ ¼å¼è½¬æ¢ï¼Œå¹¶æä¾›åˆ†å¸ƒå¼æ”¯æŒã€‚åœ¨æ¨¡åž‹è®ç»ƒå’Œæµ‹è¯•ä¸ï¼Œè¯„æµ‹å™¨ç”±[æ‰§è¡Œå™¨ï¼ˆRunnerï¼‰](https://mmengine.readthedocs.io/zh_CN/latest/api/runner.html)è‡ªåŠ¨æž„å»ºã€‚ç”¨æˆ·äº¦å¯æ ¹æ®éœ€æ±‚æ‰‹åŠ¨åˆ›å»ºè¯„æµ‹å™¨ï¼Œè¿›è¡Œç¦»çº¿è¯„æµ‹ã€‚
+
+## åœ¨æ¨¡åž‹è®ç»ƒæˆ–æµ‹è¯•ä¸è¿›è¡Œè¯„æµ‹
+
+### è¯„æµ‹æŒ‡æ ‡é…ç½®
+
+åœ¨åŸºäºŽ MMEngine è¿›è¡Œæ¨¡åž‹è®ç»ƒæˆ–æµ‹è¯•æ—¶ï¼Œæ‰§è¡Œå™¨ä¼šè‡ªåŠ¨æž„å»ºè¯„æµ‹å™¨è¿›è¡Œè¯„æµ‹ï¼Œç”¨æˆ·åªéœ€è¦åœ¨é…ç½®æ–‡ä»¶ä¸é€šè¿‡ `val_evaluator` å’Œ `test_evaluator` 2 ä¸ªå—æ®µåˆ†åˆ«æŒ‡å®šæ¨¡åž‹éªŒè¯å’Œæµ‹è¯•é˜¶æ®µçš„è¯„æµ‹æŒ‡æ ‡å³å¯ã€‚ä¾‹å¦‚ï¼Œç”¨æˆ·åœ¨ä½¿ç”¨ [MMClassification](https://github.com/open-mmlab/mmclassification) è®ç»ƒåˆ†ç±»æ¨¡åž‹æ—¶ï¼Œå¸Œæœ›åœ¨æ¨¡åž‹éªŒè¯é˜¶æ®µè¯„æµ‹ top-1 å’Œ top-5 åˆ†ç±»æ£ç¡®çŽ‡ï¼Œå¯ä»¥æŒ‰ä»¥ä¸‹æ–¹å¼é…ç½®ï¼š
+
+```python
+val_evaluator = dict(type='Accuracy', top_k=(1, 5))  # ä½¿ç”¨åˆ†ç±»æ£ç¡®çŽ‡è¯„æµ‹æŒ‡æ ‡
+```
+
+å¦‚æžœéœ€è¦åŒæ—¶è¯„æµ‹å¤šä¸ªæŒ‡æ ‡ï¼Œä¹Ÿå¯ä»¥å°† `val_evaluator` æˆ– `test_evaluator` è®¾ç½®ä¸ºä¸€ä¸ªåˆ—è¡¨ï¼Œå…¶ä¸æ¯ä¸€é¡¹ä¸ºä¸€ä¸ªè¯„æµ‹æŒ‡æ ‡çš„é…ç½®ä¿¡æ¯ã€‚ä¾‹å¦‚ï¼Œåœ¨ä½¿ç”¨ [MMDetection](https://github.com/open-mmlab/mmdetection) è®ç»ƒå…¨æ™¯åˆ†å‰²æ¨¡åž‹æ—¶ï¼Œå¸Œæœ›åœ¨æ¨¡åž‹æµ‹è¯•é˜¶æ®µåŒæ—¶è¯„æµ‹æ¨¡åž‹çš„ç›®æ ‡æ£€æµ‹ï¼ˆCOCO AP/ARï¼‰å’Œå…¨æ™¯åˆ†å‰²ç²¾åº¦ï¼Œå¯ä»¥æŒ‰ä»¥ä¸‹æ–¹å¼é…ç½®ï¼š
+
+```python
+test_evaluator = [
+    # ç›®æ ‡æ£€æµ‹æŒ‡æ ‡
+    dict(
+        type='COCOMetric',
+        metric=['bbox', 'segm'],
+        ann_file='annotations/instances_val2017.json',
+    ),
+    # å…¨æ™¯åˆ†å‰²æŒ‡æ ‡
+    dict(
+        type='CocoPanopticMetric',
+        ann_file='annotations/panoptic_val2017.json',
+        seg_prefix='annotations/panoptic_val2017',
+    )
+]
+```
+
+### è‡ªå®šä¹‰è¯„æµ‹æŒ‡æ ‡
+
+å¦‚æžœç®—æ³•åº“ä¸æä¾›çš„å¸¸ç”¨è¯„æµ‹æŒ‡æ ‡æ— æ³•æ»¡è¶³éœ€æ±‚ï¼Œç”¨æˆ·ä¹Ÿå¯ä»¥å¢žåŠ è‡ªå®šä¹‰çš„è¯„æµ‹æŒ‡æ ‡ã€‚å…·ä½“çš„æ–¹æ³•å¯ä»¥å‚è€ƒ[è¯„æµ‹æŒ‡æ ‡å’Œè¯„æµ‹å™¨è®¾è®¡](/docs/zh_cn/design/metric_and_evaluator.md)ã€‚
+
+## ä½¿ç”¨ç¦»çº¿ç»“æžœè¿›è¡Œè¯„æµ‹
+
+å¦ä¸€ç§å¸¸è§çš„æ¨¡åž‹è¯„æµ‹æ–¹å¼ï¼Œæ˜¯åˆ©ç”¨æå‰ä¿å˜åœ¨æ–‡ä»¶ä¸çš„æ¨¡åž‹é¢„æµ‹ç»“æžœè¿›è¡Œç¦»çº¿è¯„æµ‹ã€‚æ¤æ—¶ï¼Œç”±äºŽä¸å˜åœ¨æ‰§è¡Œå™¨ï¼Œç”¨æˆ·éœ€è¦æ‰‹åŠ¨æž„å»ºè¯„æµ‹å™¨ï¼Œå¹¶è°ƒç”¨è¯„æµ‹å™¨çš„ç›¸åº”æŽ¥å£å®Œæˆè¯„æµ‹ã€‚ä»¥ä¸‹æ˜¯ä¸€ä¸ªç¦»çº¿è¯„æµ‹ç¤ºä¾‹ï¼š
+
+```python
+from mmengine.evaluator import Evaluator
+from mmengine.fileio import load
+
+# æž„å»ºè¯„æµ‹å™¨ã€‚å‚æ•° `metrics` ä¸ºè¯„æµ‹æŒ‡æ ‡é…ç½®
+evaluator = Evaluator(metrics=dict(type='Accuracy', top_k=(1, 5)))
+
+# ä»Žæ–‡ä»¶ä¸è¯»å–æµ‹è¯•æ•°æ®ã€‚æ•°æ®æ ¼å¼éœ€è¦å‚è€ƒå…·ä½¿ç”¨çš„ metricã€‚
+data = load('test_data.pkl')
+
+# ä»Žæ–‡ä»¶ä¸è¯»å–æ¨¡åž‹é¢„æµ‹ç»“æžœã€‚è¯¥ç»“æžœç”±å¾…è¯„æµ‹ç®—æ³•åœ¨æµ‹è¯•æ•°æ®é›†ä¸ŠæŽ¨ç†å¾—åˆ°ã€‚
+# æ•°æ®æ ¼å¼éœ€è¦å‚è€ƒå…·ä½¿ç”¨çš„ metricã€‚
+predictions = load('prediction.pkl')
+
+# è°ƒç”¨è¯„æµ‹å™¨ç¦»çº¿è¯„æµ‹æŽ¥å£ï¼Œå¾—åˆ°è¯„æµ‹ç»“æžœ
+# chunk_size è¡¨ç¤ºæ¯æ¬¡å¤„ç†çš„æ ·æœ¬æ•°é‡ï¼Œå¯æ ¹æ®å†…å˜å¤§å°è°ƒæ•´
+results = evaluator.offline_evaluate(data, predictions, chunk_size=128)
+
+```