Generalization Error Analysis of Neural Networks with Gradient Based Regularization

Journal Home
Volume 37 - 2025
- Vol. 37, Issue 2 pp.289-602
- Vol. 37, Issue 1 pp.1-288
Volume 36 - 2024
- Vol. 36, Issue 5 pp.1157-1439
- Vol. 36, Issue 4 pp.877-1155
- Vol. 36, Issue 3 pp.581-876
- Vol. 36, Issue 2 pp.319-580
- Vol. 36, Issue 1 pp.1-318
Volume 35 - 2024
- Vol. 35, Issue 5 pp.1155-1444
- Vol. 35, Issue 4 pp.859-1154
- Vol. 35, Issue 3 pp.553-858
- Vol. 35, Issue 2 pp.273-552
- Vol. 35, Issue 1 pp.1-272
Volume 34 - 2023
- Vol. 34, Issue 5 pp.1177-1438
- Vol. 34, Issue 4 pp.869-1176
- Vol. 34, Issue 3 pp.563-868
- Vol. 34, Issue 2 pp.261-562
- Vol. 34, Issue 1 pp.1-260
Volume 33 - 2023
- Vol. 33, Issue 5 pp.1217-1513
- Vol. 33, Issue 4 pp.937-1216
- Vol. 33, Issue 3 pp.647-936
- Vol. 33, Issue 2 pp.367-646
- Vol. 33, Issue 1 pp.1-366
Volume 32 - 2022
- Vol. 32, Issue 5 pp.1217-1509
- Vol. 32, Issue 4 pp.899-1216
- Vol. 32, Issue 3 pp.595-898
- Vol. 32, Issue 2 pp.299-594
- Vol. 32, Issue 1 pp.1-298
Volume 31 - 2022
- Vol. 31, Issue 5 pp.1317-1635
- Vol. 31, Issue 4 pp.997-1316
- Vol. 31, Issue 3 pp.669-996
- Vol. 31, Issue 2 pp.331-668
- Vol. 31, Issue 1 pp.1-330
Volume 30 - 2021
- Vol. 30, Issue 5 pp.1269-1588
- Vol. 30, Issue 4 pp.959-1268
- Vol. 30, Issue 3 pp.635-958
- Vol. 30, Issue 2 pp.321-634
- Vol. 30, Issue 1 pp.1-320
Volume 29 - 2021
- Vol. 29, Issue 5 pp.1299-1622
- Vol. 29, Issue 4 pp.979-1298
- Vol. 29, Issue 3 pp.649-978
- Vol. 29, Issue 2 pp.319-648
- Vol. 29, Issue 1 pp.1-318
Volume 28 - 2020
- Vol. 28, Issue 5 pp.1639-2205
- Vol. 28, Issue 4 pp.1245-1638
- Vol. 28, Issue 3 pp.877-1244
- Vol. 28, Issue 2 pp.539-876
- Vol. 28, Issue 1 pp.1-538
Volume 27 - 2020
- Vol. 27, Issue 5 pp.1275-1589
- Vol. 27, Issue 4 pp.949-1274
- Vol. 27, Issue 3 pp.639-948
- Vol. 27, Issue 2 pp.321-638
- Vol. 27, Issue 1 pp.1-320
Volume 26 - 2019
- Vol. 26, Issue 5 pp.1249-1630
- Vol. 26, Issue 4 pp.947-1248
- Vol. 26, Issue 3 pp.631-946
- Vol. 26, Issue 2 pp.311-630
- Vol. 26, Issue 1 pp.1-310
Volume 25 - 2019
- Vol. 25, Issue 5 pp.1259-1612
- Vol. 25, Issue 4 pp.947-1258
- Vol. 25, Issue 3 pp.625-946
- Vol. 25, Issue 2 pp.311-624
- Vol. 25, Issue 1 pp.1-310
Volume 24 - 2018
- Vol. 24, Issue 5 pp.1279-1578
- Vol. 24, Issue 4 pp.899-1278
- Vol. 24, Issue 3 pp.593-898
- Vol. 24, Issue 2 pp.309-592
- Vol. 24, Issue 1 pp.1-308
Volume 23 - 2018
- Vol. 23, Issue 5 pp.1289-1625
- Vol. 23, Issue 4 pp.899-1288
- Vol. 23, Issue 3 pp.629-898
- Vol. 23, Issue 2 pp.315-628
- Vol. 23, Issue 1 pp.1-314
Volume 22 - 2017
- Vol. 22, Issue 5 pp.1175-1532
- Vol. 22, Issue 4 pp.889-1174
- Vol. 22, Issue 3 pp.599-888
- Vol. 22, Issue 2 pp.303-598
- Vol. 22, Issue 1 pp.1-302
Volume 21 - 2017
- Vol. 21, Issue 5 pp.1207-1488
- Vol. 21, Issue 4 pp.905-1206
- Vol. 21, Issue 3 pp.623-904
- Vol. 21, Issue 2 pp.313-622
- Vol. 21, Issue 1 pp.1-312
Volume 20 - 2016
- Vol. 20, Issue 5 pp.1127-1465
- Vol. 20, Issue 4 pp.835-1126
- Vol. 20, Issue 3 pp.551-834
- Vol. 20, Issue 2 pp.279-550
- Vol. 20, Issue 1 pp.1-278
Volume 19 - 2016
- Vol. 19, Issue 5 pp.1111-1563
- Vol. 19, Issue 4 pp.841-1110
- Vol. 19, Issue 3 pp.559-840
- Vol. 19, Issue 2 pp.273-558
- Vol. 19, Issue 1 pp.1-272
Volume 18 - 2015
- Vol. 18, Issue 5 pp.1211-1503
- Vol. 18, Issue 4 pp.831-1210
- Vol. 18, Issue 3 pp.529-830
- Vol. 18, Issue 2 pp.263-528
- Vol. 18, Issue 1 pp.1-262
Volume 17 - 2015
- Vol. 17, Issue 5 pp.1113-1387
- Vol. 17, Issue 4 pp.887-1112
- Vol. 17, Issue 3 pp.615-886
- Vol. 17, Issue 2 pp.317-614
- Vol. 17, Issue 1 pp.1-316
Volume 16 - 2014
- Vol. 16, Issue 5 pp.1135-1421
- Vol. 16, Issue 4 pp.841-1134
- Vol. 16, Issue 3 pp.571-840
- Vol. 16, Issue 2 pp.287-570
- Vol. 16, Issue 1 pp.1-286
Volume 15 - 2014
- Vol. 15, Issue 5 pp.1237-1503
- Vol. 15, Issue 4 pp.853-1236
- Vol. 15, Issue 3 pp.569-852
- Vol. 15, Issue 2 pp.285-568
- Vol. 15, Issue 1 pp.1-284
Volume 14 - 2013
- Vol. 14, Issue 5 pp.1147-1425
- Vol. 14, Issue 4 pp.851-1146
- Vol. 14, Issue 3 pp.537-850
- Vol. 14, Issue 2 pp.265-536
- Vol. 14, Issue 1 pp.1-264
Volume 13 - 2013
- Vol. 13, Issue 5 pp.1189-1454
- Vol. 13, Issue 4 pp.929-1188
- Vol. 13, Issue 3 pp.603-928
- Vol. 13, Issue 2 pp.325-602
- Vol. 13, Issue 1 pp.1-324
Volume 12 - 2012
- Vol. 12, Issue 5 pp.1293-1625
- Vol. 12, Issue 4 pp.919-1292
- Vol. 12, Issue 3 pp.613-918
- Vol. 12, Issue 2 pp.337-612
- Vol. 12, Issue 1 pp.1-336
Volume 11 - 2012
- Vol. 11, Issue 5 pp.1415-1721
- Vol. 11, Issue 4 pp.1043-1414
- Vol. 11, Issue 3 pp.709-1042
- Vol. 11, Issue 2 pp.271-708
- Vol. 11, Issue 1 pp.1-270
Volume 10 - 2011
- Vol. 10, Issue 5 pp.1089-1365
- Vol. 10, Issue 4 pp.785-1088
- Vol. 10, Issue 3 pp.509-784
- Vol. 10, Issue 2 pp.253-508
- Vol. 10, Issue 1 pp.1-252
Volume 9 - 2011
- Vol. 9, Issue 5 pp.1081-1433
- Vol. 9, Issue 4 pp.843-1080
- Vol. 9, Issue 3 pp.481-842
- Vol. 9, Issue 2 pp.231-480
- Vol. 9, Issue 1 pp.1-230
Volume 8 - 2010
- Vol. 8, Issue 5 pp.947-1274
- Vol. 8, Issue 4 pp.701-946
- Vol. 8, Issue 3 pp.471-700
- Vol. 8, Issue 2 pp.249-470
- Vol. 8, Issue 1 pp.1-248
Volume 7 - 2010
- Vol. 7, Issue 5 pp.877-1132
- Vol. 7, Issue 4 pp.639-876
- Vol. 7, Issue 3 pp.403-638
- Vol. 7, Issue 2 pp.235-402
- Vol. 7, Issue 1 pp.1-234
Volume 6 - 2009
- Vol. 6, Issue 5 pp.919-1165
- Vol. 6, Issue 4 pp.673-918
- Vol. 6, Issue 3 pp.433-672
- Vol. 6, Issue 2 pp.231-432
- Vol. 6, Issue 1 pp.1-230
Volume 5 - 2009
- Vol. 5, Issue 5 pp.849-1055
- Vol. 5, Issue 2-4 pp.195-848
- Vol. 5, Issue 1 pp.1-194
Volume 4 - 2008
- Vol. 4, Issue 5 pp.949-1294
- Vol. 4, Issue 4 pp.729-948
- Vol. 4, Issue 3 pp.433-728
- Vol. 4, Issue 2 pp.207-432
- Vol. 4, Issue 1 pp.1-206
Volume 3 - 2008
- Vol. 3, Issue 5 pp.973-1155
- Vol. 3, Issue 4 pp.759-972
- Vol. 3, Issue 3 pp.519-758
- Vol. 3, Issue 2 pp.271-518
- Vol. 3, Issue 1 pp.1-270
Volume 2 - 2007
- Vol. 2, Issue 6 pp.1055-1245
- Vol. 2, Issue 5 pp.827-1054
- Vol. 2, Issue 4 pp.577-826
- Vol. 2, Issue 3 pp.367-576
- Vol. 2, Issue 2 pp.177-366
- Vol. 2, Issue 1 pp.1-176
Volume 1 - 2006
- Vol. 1, Issue 6 pp.945-1118
- Vol. 1, Issue 5 pp.765-944
- Vol. 1, Issue 4 pp.575-764
- Vol. 1, Issue 3 pp.383-574
- Vol. 1, Issue 2 pp.192-382
- Vol. 1, Issue 1 pp.1-191

Volume 32, Issue 4

Lingfeng Li, Xue-Cheng Tai & Jiang Yang

DOI: 10.4208/cicp.OA-2021-0211

Commun. Comput. Phys., 32 (2022), pp. 1007-1038.

Published online: 2022-10

Preview Purchase PDF 2802 38773

Cited by

google scholar semantic scholar

Export citation

Abstract

In this work, we study gradient-based regularization methods for neural networks. We mainly focus on two regularization methods: the total variation and the Tikhonov regularization. Adding the regularization term to the training loss is equivalent to using neural networks to solve some variational problems, mostly in high dimensions in practical applications. We introduce a general framework to analyze the error between neural network solutions and true solutions to variational problems. The error consists of three parts: the approximation errors of neural networks, the quadrature errors of numerical integration, and the optimization error. We also apply the proposed framework to two-layer networks to derive a priori error estimate when the true solution belongs to the so-called Barron space. Moreover, we conduct some numerical experiments to show that neural networks can solve corresponding variational problems sufficiently well. The networks with gradient-based regularization are much more robust in image applications.

Keywords

Machine learning, regularization, generalization error, image classification.

AMS Subject Headings

68T07

Email address

BibTex
RIS
TXT

@Article{CiCP-32-1007, author = {Li , LingfengTai , Xue-Cheng and Yang , Jiang}, title = {Generalization Error Analysis of Neural Networks with Gradient Based Regularization}, journal = {Communications in Computational Physics}, year = {2022}, volume = {32}, number = {4}, pages = {1007--1038}, abstract = {

}, issn = {1991-7120}, doi = {https://doi.org/10.4208/cicp.OA-2021-0211}, url = {http://global-sci.org/intro/article_detail/cicp/21137.html} }

TY - JOUR T1 - Generalization Error Analysis of Neural Networks with Gradient Based Regularization AU - Li , Lingfeng AU - Tai , Xue-Cheng AU - Yang , Jiang JO - Communications in Computational Physics VL - 4 SP - 1007 EP - 1038 PY - 2022 DA - 2022/10 SN - 32 DO - http://doi.org/10.4208/cicp.OA-2021-0211 UR - https://global-sci.org/intro/article_detail/cicp/21137.html KW - Machine learning, regularization, generalization error, image classification. AB -

Li , LingfengTai , Xue-Cheng and Yang , Jiang. (2022). Generalization Error Analysis of Neural Networks with Gradient Based Regularization. Communications in Computational Physics. 32 (4). 1007-1038. doi:10.4208/cicp.OA-2021-0211

Copy to clipboard

BibteX RIS TXT

The citation has been copied to your clipboard

- LOGIN -

- E-mail verification -

- REGISTER -