Convergence Analysis for Over-Parameterized Deep Learning

Journal Home
Volume 37 - 2025
- Vol. 37, Issue 2 pp.289-602
- Vol. 37, Issue 1 pp.1-288
Volume 36 - 2024
- Vol. 36, Issue 5 pp.1157-1439
- Vol. 36, Issue 4 pp.877-1155
- Vol. 36, Issue 3 pp.581-876
- Vol. 36, Issue 2 pp.319-580
- Vol. 36, Issue 1 pp.1-318
Volume 35 - 2024
- Vol. 35, Issue 5 pp.1155-1444
- Vol. 35, Issue 4 pp.859-1154
- Vol. 35, Issue 3 pp.553-858
- Vol. 35, Issue 2 pp.273-552
- Vol. 35, Issue 1 pp.1-272
Volume 34 - 2023
- Vol. 34, Issue 5 pp.1177-1438
- Vol. 34, Issue 4 pp.869-1176
- Vol. 34, Issue 3 pp.563-868
- Vol. 34, Issue 2 pp.261-562
- Vol. 34, Issue 1 pp.1-260
Volume 33 - 2023
- Vol. 33, Issue 5 pp.1217-1513
- Vol. 33, Issue 4 pp.937-1216
- Vol. 33, Issue 3 pp.647-936
- Vol. 33, Issue 2 pp.367-646
- Vol. 33, Issue 1 pp.1-366
Volume 32 - 2022
- Vol. 32, Issue 5 pp.1217-1509
- Vol. 32, Issue 4 pp.899-1216
- Vol. 32, Issue 3 pp.595-898
- Vol. 32, Issue 2 pp.299-594
- Vol. 32, Issue 1 pp.1-298
Volume 31 - 2022
- Vol. 31, Issue 5 pp.1317-1635
- Vol. 31, Issue 4 pp.997-1316
- Vol. 31, Issue 3 pp.669-996
- Vol. 31, Issue 2 pp.331-668
- Vol. 31, Issue 1 pp.1-330
Volume 30 - 2021
- Vol. 30, Issue 5 pp.1269-1588
- Vol. 30, Issue 4 pp.959-1268
- Vol. 30, Issue 3 pp.635-958
- Vol. 30, Issue 2 pp.321-634
- Vol. 30, Issue 1 pp.1-320
Volume 29 - 2021
- Vol. 29, Issue 5 pp.1299-1622
- Vol. 29, Issue 4 pp.979-1298
- Vol. 29, Issue 3 pp.649-978
- Vol. 29, Issue 2 pp.319-648
- Vol. 29, Issue 1 pp.1-318
Volume 28 - 2020
- Vol. 28, Issue 5 pp.1639-2205
- Vol. 28, Issue 4 pp.1245-1638
- Vol. 28, Issue 3 pp.877-1244
- Vol. 28, Issue 2 pp.539-876
- Vol. 28, Issue 1 pp.1-538
Volume 27 - 2020
- Vol. 27, Issue 5 pp.1275-1589
- Vol. 27, Issue 4 pp.949-1274
- Vol. 27, Issue 3 pp.639-948
- Vol. 27, Issue 2 pp.321-638
- Vol. 27, Issue 1 pp.1-320
Volume 26 - 2019
- Vol. 26, Issue 5 pp.1249-1630
- Vol. 26, Issue 4 pp.947-1248
- Vol. 26, Issue 3 pp.631-946
- Vol. 26, Issue 2 pp.311-630
- Vol. 26, Issue 1 pp.1-310
Volume 25 - 2019
- Vol. 25, Issue 5 pp.1259-1612
- Vol. 25, Issue 4 pp.947-1258
- Vol. 25, Issue 3 pp.625-946
- Vol. 25, Issue 2 pp.311-624
- Vol. 25, Issue 1 pp.1-310
Volume 24 - 2018
- Vol. 24, Issue 5 pp.1279-1578
- Vol. 24, Issue 4 pp.899-1278
- Vol. 24, Issue 3 pp.593-898
- Vol. 24, Issue 2 pp.309-592
- Vol. 24, Issue 1 pp.1-308
Volume 23 - 2018
- Vol. 23, Issue 5 pp.1289-1625
- Vol. 23, Issue 4 pp.899-1288
- Vol. 23, Issue 3 pp.629-898
- Vol. 23, Issue 2 pp.315-628
- Vol. 23, Issue 1 pp.1-314
Volume 22 - 2017
- Vol. 22, Issue 5 pp.1175-1532
- Vol. 22, Issue 4 pp.889-1174
- Vol. 22, Issue 3 pp.599-888
- Vol. 22, Issue 2 pp.303-598
- Vol. 22, Issue 1 pp.1-302
Volume 21 - 2017
- Vol. 21, Issue 5 pp.1207-1488
- Vol. 21, Issue 4 pp.905-1206
- Vol. 21, Issue 3 pp.623-904
- Vol. 21, Issue 2 pp.313-622
- Vol. 21, Issue 1 pp.1-312
Volume 20 - 2016
- Vol. 20, Issue 5 pp.1127-1465
- Vol. 20, Issue 4 pp.835-1126
- Vol. 20, Issue 3 pp.551-834
- Vol. 20, Issue 2 pp.279-550
- Vol. 20, Issue 1 pp.1-278
Volume 19 - 2016
- Vol. 19, Issue 5 pp.1111-1563
- Vol. 19, Issue 4 pp.841-1110
- Vol. 19, Issue 3 pp.559-840
- Vol. 19, Issue 2 pp.273-558
- Vol. 19, Issue 1 pp.1-272
Volume 18 - 2015
- Vol. 18, Issue 5 pp.1211-1503
- Vol. 18, Issue 4 pp.831-1210
- Vol. 18, Issue 3 pp.529-830
- Vol. 18, Issue 2 pp.263-528
- Vol. 18, Issue 1 pp.1-262
Volume 17 - 2015
- Vol. 17, Issue 5 pp.1113-1387
- Vol. 17, Issue 4 pp.887-1112
- Vol. 17, Issue 3 pp.615-886
- Vol. 17, Issue 2 pp.317-614
- Vol. 17, Issue 1 pp.1-316
Volume 16 - 2014
- Vol. 16, Issue 5 pp.1135-1421
- Vol. 16, Issue 4 pp.841-1134
- Vol. 16, Issue 3 pp.571-840
- Vol. 16, Issue 2 pp.287-570
- Vol. 16, Issue 1 pp.1-286
Volume 15 - 2014
- Vol. 15, Issue 5 pp.1237-1503
- Vol. 15, Issue 4 pp.853-1236
- Vol. 15, Issue 3 pp.569-852
- Vol. 15, Issue 2 pp.285-568
- Vol. 15, Issue 1 pp.1-284
Volume 14 - 2013
- Vol. 14, Issue 5 pp.1147-1425
- Vol. 14, Issue 4 pp.851-1146
- Vol. 14, Issue 3 pp.537-850
- Vol. 14, Issue 2 pp.265-536
- Vol. 14, Issue 1 pp.1-264
Volume 13 - 2013
- Vol. 13, Issue 5 pp.1189-1454
- Vol. 13, Issue 4 pp.929-1188
- Vol. 13, Issue 3 pp.603-928
- Vol. 13, Issue 2 pp.325-602
- Vol. 13, Issue 1 pp.1-324
Volume 12 - 2012
- Vol. 12, Issue 5 pp.1293-1625
- Vol. 12, Issue 4 pp.919-1292
- Vol. 12, Issue 3 pp.613-918
- Vol. 12, Issue 2 pp.337-612
- Vol. 12, Issue 1 pp.1-336
Volume 11 - 2012
- Vol. 11, Issue 5 pp.1415-1721
- Vol. 11, Issue 4 pp.1043-1414
- Vol. 11, Issue 3 pp.709-1042
- Vol. 11, Issue 2 pp.271-708
- Vol. 11, Issue 1 pp.1-270
Volume 10 - 2011
- Vol. 10, Issue 5 pp.1089-1365
- Vol. 10, Issue 4 pp.785-1088
- Vol. 10, Issue 3 pp.509-784
- Vol. 10, Issue 2 pp.253-508
- Vol. 10, Issue 1 pp.1-252
Volume 9 - 2011
- Vol. 9, Issue 5 pp.1081-1433
- Vol. 9, Issue 4 pp.843-1080
- Vol. 9, Issue 3 pp.481-842
- Vol. 9, Issue 2 pp.231-480
- Vol. 9, Issue 1 pp.1-230
Volume 8 - 2010
- Vol. 8, Issue 5 pp.947-1274
- Vol. 8, Issue 4 pp.701-946
- Vol. 8, Issue 3 pp.471-700
- Vol. 8, Issue 2 pp.249-470
- Vol. 8, Issue 1 pp.1-248
Volume 7 - 2010
- Vol. 7, Issue 5 pp.877-1132
- Vol. 7, Issue 4 pp.639-876
- Vol. 7, Issue 3 pp.403-638
- Vol. 7, Issue 2 pp.235-402
- Vol. 7, Issue 1 pp.1-234
Volume 6 - 2009
- Vol. 6, Issue 5 pp.919-1165
- Vol. 6, Issue 4 pp.673-918
- Vol. 6, Issue 3 pp.433-672
- Vol. 6, Issue 2 pp.231-432
- Vol. 6, Issue 1 pp.1-230
Volume 5 - 2009
- Vol. 5, Issue 5 pp.849-1055
- Vol. 5, Issue 2-4 pp.195-848
- Vol. 5, Issue 1 pp.1-194
Volume 4 - 2008
- Vol. 4, Issue 5 pp.949-1294
- Vol. 4, Issue 4 pp.729-948
- Vol. 4, Issue 3 pp.433-728
- Vol. 4, Issue 2 pp.207-432
- Vol. 4, Issue 1 pp.1-206
Volume 3 - 2008
- Vol. 3, Issue 5 pp.973-1155
- Vol. 3, Issue 4 pp.759-972
- Vol. 3, Issue 3 pp.519-758
- Vol. 3, Issue 2 pp.271-518
- Vol. 3, Issue 1 pp.1-270
Volume 2 - 2007
- Vol. 2, Issue 6 pp.1055-1245
- Vol. 2, Issue 5 pp.827-1054
- Vol. 2, Issue 4 pp.577-826
- Vol. 2, Issue 3 pp.367-576
- Vol. 2, Issue 2 pp.177-366
- Vol. 2, Issue 1 pp.1-176
Volume 1 - 2006
- Vol. 1, Issue 6 pp.945-1118
- Vol. 1, Issue 5 pp.765-944
- Vol. 1, Issue 4 pp.575-764
- Vol. 1, Issue 3 pp.383-574
- Vol. 1, Issue 2 pp.192-382
- Vol. 1, Issue 1 pp.1-191

Volume 36, Issue 1

Yuling Jiao, Xiliang Lu, Peiying Wu & Jerry Zhijian Yang

DOI: 10.4208/cicp.OA-2023-0264

Commun. Comput. Phys., 36 (2024), pp. 71-103.

Published online: 2024-07

Preview Full PDF 1429 19390

Cited by

google scholar semantic scholar

Export citation

Abstract

The success of deep learning in various applications has generated a growing interest in understanding its theoretical foundations. This paper presents a theoretical framework that explains why over-parameterized neural networks can perform well. Our analysis begins from the perspective of approximation theory and argues that over-parameterized deep neural networks with bounded norms can effectively approximate the target. Additionally, we demonstrate that the metric entropy of such networks is independent of the number of network parameters. We utilize these findings to derive consistency results for over-parameterized deep regression and the deep Ritz method, respectively. Furthermore, we prove convergence rates when the target has higher regularity, which, to our knowledge, represents the first convergence rate for over-parameterized deep learning.

Keywords

Over-parameterization, convergence rate, approximation, generalization.

AMS Subject Headings

65M15, 65N15, 65Y20

Email address

BibTex
RIS
TXT

@Article{CiCP-36-71, author = {Jiao , YulingLu , XiliangWu , Peiying and Yang , Jerry Zhijian}, title = {Convergence Analysis for Over-Parameterized Deep Learning}, journal = {Communications in Computational Physics}, year = {2024}, volume = {36}, number = {1}, pages = {71--103}, abstract = {

}, issn = {1991-7120}, doi = {https://doi.org/10.4208/cicp.OA-2023-0264}, url = {http://global-sci.org/intro/article_detail/cicp/23297.html} }

TY - JOUR T1 - Convergence Analysis for Over-Parameterized Deep Learning AU - Jiao , Yuling AU - Lu , Xiliang AU - Wu , Peiying AU - Yang , Jerry Zhijian JO - Communications in Computational Physics VL - 1 SP - 71 EP - 103 PY - 2024 DA - 2024/07 SN - 36 DO - http://doi.org/10.4208/cicp.OA-2023-0264 UR - https://global-sci.org/intro/article_detail/cicp/23297.html KW - Over-parameterization, convergence rate, approximation, generalization. AB -

Jiao , YulingLu , XiliangWu , Peiying and Yang , Jerry Zhijian. (2024). Convergence Analysis for Over-Parameterized Deep Learning. Communications in Computational Physics. 36 (1). 71-103. doi:10.4208/cicp.OA-2023-0264

Copy to clipboard

BibteX RIS TXT

The citation has been copied to your clipboard

- LOGIN -

- E-mail verification -

- REGISTER -