diff --git a/docs/en/common_usage/better_optimizers.md b/docs/en/common_usage/better_optimizers.md
new file mode 100644
index 0000000000000000000000000000000000000000..63a1e568662944793d138cb33b4478e29189064e
--- /dev/null
+++ b/docs/en/common_usage/better_optimizers.md
@@ -0,0 +1,92 @@
+# Better performance optimizers
+
+This document provides some third-party optimizers supported by MMEngine, which may bring faster convergence speed or higher performance.
+
+## D-Adaptation
+
+[D-Adaptation](https://github.com/facebookresearch/dadaptation) provides `DAdaptAdaGrad`, `DAdaptAdam` and `DAdaptSGD` optimziersã€‚
+
+```{note}
+If you use the optimizer provided by D-Adaptation, you need to upgrade mmengine to `0.6.0`.
+```
+
+- Installation
+
+```bash
+pip install dadaptation
+```
+
+- Usage
+
+Take the `DAdaptAdaGrad` as an example.
+
+```python
+runner = Runner(
+    model=ResNet18(),
+    work_dir='./work_dir',
+    train_dataloader=train_dataloader_cfg,
+    # To view the input parameters for DAdaptAdaGrad, you can refer to
+    # https://github.com/facebookresearch/dadaptation/blob/main/dadaptation/dadapt_adagrad.py
+    optim_wrapper=dict(optimizer=dict(type='DAdaptAdaGrad', lr=0.001, momentum=0.9)),
+    train_cfg=dict(by_epoch=True, max_epochs=3),
+)
+runner.train()
+```
+
+## Lion-Pytorch
+
+[lion-pytorch](https://github.com/lucidrains/lion-pytorch) provides the `Lion` optimizerã€‚
+
+```{note}
+If you use the optimizer provided by Lion-Pytorch, you need to upgrade mmengine to `0.6.0`.
+```
+
+- Installation
+
+```bash
+pip install lion-pytorch
+```
+
+- Usage
+
+```python
+runner = Runner(
+    model=ResNet18(),
+    work_dir='./work_dir',
+    train_dataloader=train_dataloader_cfg,
+    # To view the input parameters for Lion, you can refer to
+    # https://github.com/lucidrains/lion-pytorch/blob/main/lion_pytorch/lion_pytorch.py
+    optim_wrapper=dict(optimizer=dict(type='Lion', lr=1e-4, weight_decay=1e-2)),
+    train_cfg=dict(by_epoch=True, max_epochs=3),
+)
+runner.train()
+```
+
+## Sophia
+
+[Sophia](https://github.com/kyegomez/Sophia) provides `Sophia`, `SophiaG`, `DecoupledSophia` and `Sophia2` optimizers.
+
+```{note}
+If you use the optimizer provided by Sophia, you need to upgrade mmengine to `0.7.4`.
+```
+
+- Installation
+
+```bash
+pip install Sophia-Optimizer
+```
+
+- Usage
+
+```python
+runner = Runner(
+    model=ResNet18(),
+    work_dir='./work_dir',
+    train_dataloader=train_dataloader_cfg,
+    # To view the input parameters for SophiaG, you can refer to
+    # https://github.com/kyegomez/Sophia/blob/main/Sophia/Sophia.py
+    optim_wrapper=dict(optimizer=dict(type='SophiaG', lr=2e-4, betas=(0.965, 0.99), rho = 0.01, weight_decay=1e-1)),
+    train_cfg=dict(by_epoch=True, max_epochs=3),
+)
+runner.train()
+```
diff --git a/docs/en/index.rst b/docs/en/index.rst
index 978c582010115310d449fb80d3fa36001a66d5a5..a1363f1133b9c256eb874b5fc6d977a4db341d80 100644
--- a/docs/en/index.rst
+++ b/docs/en/index.rst
@@ -24,6 +24,7 @@ You can switch between Chinese and English documents in the lower-left corner of
    common_usage/distributed_training.md
    common_usage/speed_up_training.md
    common_usage/save_gpu_memory.md
+   common_usage/better_optimizers.md
    common_usage/visualize_training_log.md
    common_usage/set_random_seed.md
    common_usage/debug_tricks.md
diff --git a/docs/en/tutorials/optim_wrapper.md b/docs/en/tutorials/optim_wrapper.md
index 370eec62c6b2461f601850043267775df87f8e9f..0840d16c082be742f9ad816b226d72f80353d56a 100644
--- a/docs/en/tutorials/optim_wrapper.md
+++ b/docs/en/tutorials/optim_wrapper.md
@@ -243,7 +243,7 @@ As shown in the above example, `OptimWrapperDict` exports learning rates and mom
 
 ### Configure the OptimWapper in [Runner](runner.md)
 
-We first need to configure the `optimizer` for the OptimWrapper. MMEngine automatically adds all optimizers in PyTorch to the `OPTIMIZERS` registry, and users can specify the optimizers they need in the form of a `dict`. All supported optimizers in PyTorch are listed [here](https://pytorch.org/docs/stable/optim.html#algorithms). In addition, `DAdaptAdaGrad`, `DAdaptAdam`, and `DAdaptSGD` can be used by installing [dadaptation](https://github.com/facebookresearch/dadaptation). `Lion` optimizer can used by install [lion-pytorch](https://github.com/lucidrains/lion-pytorch).
+We first need to configure the `optimizer` for the OptimWrapper. MMEngine automatically adds all optimizers in PyTorch to the `OPTIMIZERS` registry, and users can specify the optimizers they need in the form of a `dict`. All supported optimizers in PyTorch are listed [here](https://pytorch.org/docs/stable/optim.html#algorithms).
 
 Now we take setting up a SGD OptimWrapper as an example.
 
diff --git a/docs/zh_cn/common_usage/better_optimizers.md b/docs/zh_cn/common_usage/better_optimizers.md
new file mode 100644
index 0000000000000000000000000000000000000000..a70c84b7f09566521591888028ff6cc263c2d19a
--- /dev/null
+++ b/docs/zh_cn/common_usage/better_optimizers.md
@@ -0,0 +1,92 @@
+# æ€§èƒ½æ›´ä¼˜çš„ä¼˜åŒ–å™¨
+
+æœ¬æ–‡æ¡£æä¾›äº†ä¸€äº› MMEngine æ”¯æŒçš„ç¬¬ä¸‰æ–¹ä¼˜åŒ–å™¨ï¼Œå®ƒä»¬å¯èƒ½ä¼šå¸¦æ¥æ›´å¿«çš„æ”¶æ•›é€Ÿåº¦æˆ–è€…æ›´é«˜çš„æ€§èƒ½ã€‚
+
+## D-Adaptation
+
+[D-Adaptation](https://github.com/facebookresearch/dadaptation) æä¾›äº† `DAdaptAdaGrad`ã€`DAdaptAdam` å’Œ `DAdaptSGD` ä¼˜åŒ–å™¨ã€‚
+
+```{note}
+å¦‚ä½¿ç”¨ D-Adaptation æä¾›çš„ä¼˜åŒ–å™¨ï¼Œéœ€å°† mmengine å‡çº§è‡³ `0.6.0`ã€‚
+```
+
+- å®‰è£…
+
+```bash
+pip install dadaptation
+```
+
+- ä½¿ç”¨
+
+ä»¥ä½¿ç”¨ `DAdaptAdaGrad` ä¸ºä¾‹ã€‚
+
+```python
+runner = Runner(
+    model=ResNet18(),
+    work_dir='./work_dir',
+    train_dataloader=train_dataloader_cfg,
+    # å¦‚éœ€æŸ¥çœ‹ DAdaptAdaGrad çš„è¾“å…¥å‚æ•°ï¼Œå¯æŸ¥çœ‹
+    # https://github.com/facebookresearch/dadaptation/blob/main/dadaptation/dadapt_adagrad.py
+    optim_wrapper=dict(optimizer=dict(type='DAdaptAdaGrad', lr=0.001, momentum=0.9)),
+    train_cfg=dict(by_epoch=True, max_epochs=3),
+)
+runner.train()
+```
+
+## Lion
+
+[lion-pytorch](https://github.com/lucidrains/lion-pytorch) æä¾›äº† `Lion` ä¼˜åŒ–å™¨ã€‚
+
+```{note}
+å¦‚ä½¿ç”¨ Lion æä¾›çš„ä¼˜åŒ–å™¨ï¼Œéœ€å°† mmengine å‡çº§è‡³ `0.6.0`ã€‚
+```
+
+- å®‰è£…
+
+```bash
+pip install lion-pytorch
+```
+
+- ä½¿ç”¨
+
+```python
+runner = Runner(
+    model=ResNet18(),
+    work_dir='./work_dir',
+    train_dataloader=train_dataloader_cfg,
+    # å¦‚éœ€æŸ¥çœ‹ Lion çš„è¾“å…¥å‚æ•°ï¼Œå¯æŸ¥çœ‹
+    # https://github.com/lucidrains/lion-pytorch/blob/main/lion_pytorch/lion_pytorch.py
+    optim_wrapper=dict(optimizer=dict(type='Lion', lr=1e-4, weight_decay=1e-2)),
+    train_cfg=dict(by_epoch=True, max_epochs=3),
+)
+runner.train()
+```
+
+## Sophia
+
+[Sophia](https://github.com/kyegomez/Sophia) æä¾›äº† `Sophia`ã€`SophiaG`ã€`DecoupledSophia` å’Œ `Sophia2` ä¼˜åŒ–å™¨ã€‚
+
+```{note}
+å¦‚ä½¿ç”¨ Sophia æä¾›çš„ä¼˜åŒ–å™¨ï¼Œéœ€å°† mmengine å‡çº§è‡³ `0.7.4`ã€‚
+```
+
+- å®‰è£…
+
+```bash
+pip install Sophia-Optimizer
+```
+
+- ä½¿ç”¨
+
+```python
+runner = Runner(
+    model=ResNet18(),
+    work_dir='./work_dir',
+    train_dataloader=train_dataloader_cfg,
+    # å¦‚éœ€æŸ¥çœ‹ SophiaG çš„è¾“å…¥å‚æ•°ï¼Œå¯æŸ¥çœ‹
+    # https://github.com/kyegomez/Sophia/blob/main/Sophia/Sophia.py
+    optim_wrapper=dict(optimizer=dict(type='SophiaG', lr=2e-4, betas=(0.965, 0.99), rho = 0.01, weight_decay=1e-1)),
+    train_cfg=dict(by_epoch=True, max_epochs=3),
+)
+runner.train()
+```
diff --git a/docs/zh_cn/index.rst b/docs/zh_cn/index.rst
index 87010a71d5e6a12c453787cbff87d6b291c25290..9191c4a3837b06762918c865632df36a05c612a0 100644
--- a/docs/zh_cn/index.rst
+++ b/docs/zh_cn/index.rst
@@ -24,6 +24,7 @@
    common_usage/distributed_training.md
    common_usage/speed_up_training.md
    common_usage/save_gpu_memory.md
+   common_usage/better_optimizers.md
    common_usage/visualize_training_log.md
    common_usage/set_random_seed.md
    common_usage/debug_tricks.md
diff --git a/docs/zh_cn/tutorials/optim_wrapper.md b/docs/zh_cn/tutorials/optim_wrapper.md
index 05e703656d468e25f64f5823ab519b381c7472b5..2c9c7d6bc0a18507889e59784fe3d95e53fa5d8a 100644
--- a/docs/zh_cn/tutorials/optim_wrapper.md
+++ b/docs/zh_cn/tutorials/optim_wrapper.md
@@ -243,7 +243,7 @@ print(optim_dict.get_momentum())  # {'gen.momentum': [0], 'disc.momentum': [0]}
 
 ### åœ¨[æ‰§è¡Œå™¨](./runner.md)ä¸é…ç½®ä¼˜åŒ–å™¨å°è£…
 
-ä¼˜åŒ–å™¨å°è£…éœ€è¦æŽ¥å— `optimizer` å‚æ•°ï¼Œå› æ¤æˆ‘ä»¬é¦–å…ˆéœ€è¦ä¸ºä¼˜åŒ–å™¨å°è£…é…ç½® `optimizer`ã€‚MMEngine ä¼šè‡ªåŠ¨å°† PyTorch ä¸çš„æ‰€æœ‰ä¼˜åŒ–å™¨éƒ½æ·»åŠ è¿› `OPTIMIZERS` æ³¨å†Œè¡¨ä¸ï¼Œç”¨æˆ·å¯ä»¥ç”¨å—å…¸çš„å½¢å¼æ¥æŒ‡å®šä¼˜åŒ–å™¨ï¼Œæ‰€æœ‰æ”¯æŒçš„ä¼˜åŒ–å™¨è§ [PyTorch ä¼˜åŒ–å™¨åˆ—è¡¨](https://pytorch.org/docs/stable/optim.html#algorithms)ã€‚å¦å¤–ï¼Œå¯ä»¥é€šè¿‡å®‰è£… [dadaptation](https://github.com/facebookresearch/dadaptation) ä½¿ç”¨ `DAdaptAdaGrad`ã€`DAdaptAdam` å’Œ `DAdaptSGD` 3 ä¸ªä¼˜åŒ–å™¨ã€‚ä¹Ÿå¯ä»¥é€šè¿‡å®‰è£… [lion-pytorch](https://github.com/lucidrains/lion-pytorch) ä½¿ç”¨ `Lion` ä¼˜åŒ–å™¨ã€‚
+ä¼˜åŒ–å™¨å°è£…éœ€è¦æŽ¥å— `optimizer` å‚æ•°ï¼Œå› æ¤æˆ‘ä»¬é¦–å…ˆéœ€è¦ä¸ºä¼˜åŒ–å™¨å°è£…é…ç½® `optimizer`ã€‚MMEngine ä¼šè‡ªåŠ¨å°† PyTorch ä¸çš„æ‰€æœ‰ä¼˜åŒ–å™¨éƒ½æ·»åŠ è¿› `OPTIMIZERS` æ³¨å†Œè¡¨ä¸ï¼Œç”¨æˆ·å¯ä»¥ç”¨å—å…¸çš„å½¢å¼æ¥æŒ‡å®šä¼˜åŒ–å™¨ï¼Œæ‰€æœ‰æ”¯æŒçš„ä¼˜åŒ–å™¨è§ [PyTorch ä¼˜åŒ–å™¨åˆ—è¡¨](https://pytorch.org/docs/stable/optim.html#algorithms)ã€‚
 
 ä»¥é…ç½®ä¸€ä¸ª SGD ä¼˜åŒ–å™¨å°è£…ä¸ºä¾‹ï¼š
 
diff --git a/mmengine/optim/optimizer/builder.py b/mmengine/optim/optimizer/builder.py
index 65782ff12c3ac95591daa9c24f7f0a4ea0e99b6c..9dcfde0e3682cb0b2ca84b8585991f483af578b2 100644
--- a/mmengine/optim/optimizer/builder.py
+++ b/mmengine/optim/optimizer/builder.py
@@ -105,6 +105,30 @@ def register_lion_optimizers() -> List[str]:
 LION_OPTIMIZERS = register_lion_optimizers()
 
 
+def register_sophia_optimizers() -> List[str]:
+    """Register Sophia optimizer to the ``OPTIMIZERS`` registry.
+
+    Returns:
+        List[str]: A list of registered optimizers' name.
+    """
+    optimizers = []
+    try:
+        import Sophia
+    except ImportError:
+        pass
+    else:
+        for module_name in dir(Sophia):
+            _optim = getattr(Sophia, module_name)
+            if inspect.isclass(_optim) and issubclass(_optim,
+                                                      torch.optim.Optimizer):
+                OPTIMIZERS.register_module(module=_optim)
+                optimizers.append(module_name)
+    return optimizers
+
+
+SOPHIA_OPTIMIZERS = register_sophia_optimizers()
+
+
 def build_optim_wrapper(model: nn.Module,
                         cfg: Union[dict, Config, ConfigDict]) -> OptimWrapper:
     """Build function of OptimWrapper.