Loss Jump During Loss Switch in Solving PDEs with Neural Networks

Journal Home
Volume 37 - 2025
- Vol. 37, Issue 2 pp.289-602
- Vol. 37, Issue 1 pp.1-288
Volume 36 - 2024
- Vol. 36, Issue 5 pp.1157-1439
- Vol. 36, Issue 4 pp.877-1155
- Vol. 36, Issue 3 pp.581-876
- Vol. 36, Issue 2 pp.319-580
- Vol. 36, Issue 1 pp.1-318
Volume 35 - 2024
- Vol. 35, Issue 5 pp.1155-1444
- Vol. 35, Issue 4 pp.859-1154
- Vol. 35, Issue 3 pp.553-858
- Vol. 35, Issue 2 pp.273-552
- Vol. 35, Issue 1 pp.1-272
Volume 34 - 2023
- Vol. 34, Issue 5 pp.1177-1438
- Vol. 34, Issue 4 pp.869-1176
- Vol. 34, Issue 3 pp.563-868
- Vol. 34, Issue 2 pp.261-562
- Vol. 34, Issue 1 pp.1-260
Volume 33 - 2023
- Vol. 33, Issue 5 pp.1217-1513
- Vol. 33, Issue 4 pp.937-1216
- Vol. 33, Issue 3 pp.647-936
- Vol. 33, Issue 2 pp.367-646
- Vol. 33, Issue 1 pp.1-366
Volume 32 - 2022
- Vol. 32, Issue 5 pp.1217-1509
- Vol. 32, Issue 4 pp.899-1216
- Vol. 32, Issue 3 pp.595-898
- Vol. 32, Issue 2 pp.299-594
- Vol. 32, Issue 1 pp.1-298
Volume 31 - 2022
- Vol. 31, Issue 5 pp.1317-1635
- Vol. 31, Issue 4 pp.997-1316
- Vol. 31, Issue 3 pp.669-996
- Vol. 31, Issue 2 pp.331-668
- Vol. 31, Issue 1 pp.1-330
Volume 30 - 2021
- Vol. 30, Issue 5 pp.1269-1588
- Vol. 30, Issue 4 pp.959-1268
- Vol. 30, Issue 3 pp.635-958
- Vol. 30, Issue 2 pp.321-634
- Vol. 30, Issue 1 pp.1-320
Volume 29 - 2021
- Vol. 29, Issue 5 pp.1299-1622
- Vol. 29, Issue 4 pp.979-1298
- Vol. 29, Issue 3 pp.649-978
- Vol. 29, Issue 2 pp.319-648
- Vol. 29, Issue 1 pp.1-318
Volume 28 - 2020
- Vol. 28, Issue 5 pp.1639-2205
- Vol. 28, Issue 4 pp.1245-1638
- Vol. 28, Issue 3 pp.877-1244
- Vol. 28, Issue 2 pp.539-876
- Vol. 28, Issue 1 pp.1-538
Volume 27 - 2020
- Vol. 27, Issue 5 pp.1275-1589
- Vol. 27, Issue 4 pp.949-1274
- Vol. 27, Issue 3 pp.639-948
- Vol. 27, Issue 2 pp.321-638
- Vol. 27, Issue 1 pp.1-320
Volume 26 - 2019
- Vol. 26, Issue 5 pp.1249-1630
- Vol. 26, Issue 4 pp.947-1248
- Vol. 26, Issue 3 pp.631-946
- Vol. 26, Issue 2 pp.311-630
- Vol. 26, Issue 1 pp.1-310
Volume 25 - 2019
- Vol. 25, Issue 5 pp.1259-1612
- Vol. 25, Issue 4 pp.947-1258
- Vol. 25, Issue 3 pp.625-946
- Vol. 25, Issue 2 pp.311-624
- Vol. 25, Issue 1 pp.1-310
Volume 24 - 2018
- Vol. 24, Issue 5 pp.1279-1578
- Vol. 24, Issue 4 pp.899-1278
- Vol. 24, Issue 3 pp.593-898
- Vol. 24, Issue 2 pp.309-592
- Vol. 24, Issue 1 pp.1-308
Volume 23 - 2018
- Vol. 23, Issue 5 pp.1289-1625
- Vol. 23, Issue 4 pp.899-1288
- Vol. 23, Issue 3 pp.629-898
- Vol. 23, Issue 2 pp.315-628
- Vol. 23, Issue 1 pp.1-314
Volume 22 - 2017
- Vol. 22, Issue 5 pp.1175-1532
- Vol. 22, Issue 4 pp.889-1174
- Vol. 22, Issue 3 pp.599-888
- Vol. 22, Issue 2 pp.303-598
- Vol. 22, Issue 1 pp.1-302
Volume 21 - 2017
- Vol. 21, Issue 5 pp.1207-1488
- Vol. 21, Issue 4 pp.905-1206
- Vol. 21, Issue 3 pp.623-904
- Vol. 21, Issue 2 pp.313-622
- Vol. 21, Issue 1 pp.1-312
Volume 20 - 2016
- Vol. 20, Issue 5 pp.1127-1465
- Vol. 20, Issue 4 pp.835-1126
- Vol. 20, Issue 3 pp.551-834
- Vol. 20, Issue 2 pp.279-550
- Vol. 20, Issue 1 pp.1-278
Volume 19 - 2016
- Vol. 19, Issue 5 pp.1111-1563
- Vol. 19, Issue 4 pp.841-1110
- Vol. 19, Issue 3 pp.559-840
- Vol. 19, Issue 2 pp.273-558
- Vol. 19, Issue 1 pp.1-272
Volume 18 - 2015
- Vol. 18, Issue 5 pp.1211-1503
- Vol. 18, Issue 4 pp.831-1210
- Vol. 18, Issue 3 pp.529-830
- Vol. 18, Issue 2 pp.263-528
- Vol. 18, Issue 1 pp.1-262
Volume 17 - 2015
- Vol. 17, Issue 5 pp.1113-1387
- Vol. 17, Issue 4 pp.887-1112
- Vol. 17, Issue 3 pp.615-886
- Vol. 17, Issue 2 pp.317-614
- Vol. 17, Issue 1 pp.1-316
Volume 16 - 2014
- Vol. 16, Issue 5 pp.1135-1421
- Vol. 16, Issue 4 pp.841-1134
- Vol. 16, Issue 3 pp.571-840
- Vol. 16, Issue 2 pp.287-570
- Vol. 16, Issue 1 pp.1-286
Volume 15 - 2014
- Vol. 15, Issue 5 pp.1237-1503
- Vol. 15, Issue 4 pp.853-1236
- Vol. 15, Issue 3 pp.569-852
- Vol. 15, Issue 2 pp.285-568
- Vol. 15, Issue 1 pp.1-284
Volume 14 - 2013
- Vol. 14, Issue 5 pp.1147-1425
- Vol. 14, Issue 4 pp.851-1146
- Vol. 14, Issue 3 pp.537-850
- Vol. 14, Issue 2 pp.265-536
- Vol. 14, Issue 1 pp.1-264
Volume 13 - 2013
- Vol. 13, Issue 5 pp.1189-1454
- Vol. 13, Issue 4 pp.929-1188
- Vol. 13, Issue 3 pp.603-928
- Vol. 13, Issue 2 pp.325-602
- Vol. 13, Issue 1 pp.1-324
Volume 12 - 2012
- Vol. 12, Issue 5 pp.1293-1625
- Vol. 12, Issue 4 pp.919-1292
- Vol. 12, Issue 3 pp.613-918
- Vol. 12, Issue 2 pp.337-612
- Vol. 12, Issue 1 pp.1-336
Volume 11 - 2012
- Vol. 11, Issue 5 pp.1415-1721
- Vol. 11, Issue 4 pp.1043-1414
- Vol. 11, Issue 3 pp.709-1042
- Vol. 11, Issue 2 pp.271-708
- Vol. 11, Issue 1 pp.1-270
Volume 10 - 2011
- Vol. 10, Issue 5 pp.1089-1365
- Vol. 10, Issue 4 pp.785-1088
- Vol. 10, Issue 3 pp.509-784
- Vol. 10, Issue 2 pp.253-508
- Vol. 10, Issue 1 pp.1-252
Volume 9 - 2011
- Vol. 9, Issue 5 pp.1081-1433
- Vol. 9, Issue 4 pp.843-1080
- Vol. 9, Issue 3 pp.481-842
- Vol. 9, Issue 2 pp.231-480
- Vol. 9, Issue 1 pp.1-230
Volume 8 - 2010
- Vol. 8, Issue 5 pp.947-1274
- Vol. 8, Issue 4 pp.701-946
- Vol. 8, Issue 3 pp.471-700
- Vol. 8, Issue 2 pp.249-470
- Vol. 8, Issue 1 pp.1-248
Volume 7 - 2010
- Vol. 7, Issue 5 pp.877-1132
- Vol. 7, Issue 4 pp.639-876
- Vol. 7, Issue 3 pp.403-638
- Vol. 7, Issue 2 pp.235-402
- Vol. 7, Issue 1 pp.1-234
Volume 6 - 2009
- Vol. 6, Issue 5 pp.919-1165
- Vol. 6, Issue 4 pp.673-918
- Vol. 6, Issue 3 pp.433-672
- Vol. 6, Issue 2 pp.231-432
- Vol. 6, Issue 1 pp.1-230
Volume 5 - 2009
- Vol. 5, Issue 5 pp.849-1055
- Vol. 5, Issue 2-4 pp.195-848
- Vol. 5, Issue 1 pp.1-194
Volume 4 - 2008
- Vol. 4, Issue 5 pp.949-1294
- Vol. 4, Issue 4 pp.729-948
- Vol. 4, Issue 3 pp.433-728
- Vol. 4, Issue 2 pp.207-432
- Vol. 4, Issue 1 pp.1-206
Volume 3 - 2008
- Vol. 3, Issue 5 pp.973-1155
- Vol. 3, Issue 4 pp.759-972
- Vol. 3, Issue 3 pp.519-758
- Vol. 3, Issue 2 pp.271-518
- Vol. 3, Issue 1 pp.1-270
Volume 2 - 2007
- Vol. 2, Issue 6 pp.1055-1245
- Vol. 2, Issue 5 pp.827-1054
- Vol. 2, Issue 4 pp.577-826
- Vol. 2, Issue 3 pp.367-576
- Vol. 2, Issue 2 pp.177-366
- Vol. 2, Issue 1 pp.1-176
Volume 1 - 2006
- Vol. 1, Issue 6 pp.945-1118
- Vol. 1, Issue 5 pp.765-944
- Vol. 1, Issue 4 pp.575-764
- Vol. 1, Issue 3 pp.383-574
- Vol. 1, Issue 2 pp.192-382
- Vol. 1, Issue 1 pp.1-191

Volume 36, Issue 4

Zhiwei Wang, Lulu Zhang, Zhongwang Zhang & Zhi-Qin John Xu

DOI: 10.4208/cicp.OA-2024-0096

Commun. Comput. Phys., 36 (2024), pp. 1090-1112.

Published online: 2024-10

Preview Purchase PDF 671 9233

Cited by

google scholar semantic scholar

Export citation

Abstract

Using neural networks to solve partial differential equations (PDEs) is gaining popularity as an alternative approach in the scientific computing community. Neural networks can integrate different types of information into the loss function. These include observation data, governing equations, and variational forms, etc. These loss functions can be broadly categorized into two types: observation data loss directly constrains and measures the model output, while other loss functions indirectly model the performance of the network, which can be classified as model loss. However, this alternative approach lacks a thorough understanding of its underlying mechanisms, including theoretical foundations and rigorous characterization of various phenomena. This work focuses on investigating how different loss functions impact the training of neural networks for solving PDEs. We discover a stable loss-jump phenomenon: when switching the loss function from the data loss to the model loss, which includes different orders of derivative information, the neural network solution significantly deviates from the exact solution immediately. Further experiments reveal that this phenomenon arises from the different frequency preferences of neural networks under different loss functions. We theoretically analyze the frequency preference of neural networks under model loss. This loss-jump phenomenon provides a valuable perspective for examining the underlying mechanisms of neural networks in solving PDEs.

Keywords

Loss jump, frequency bias, neural network, loss switch.

AMS Subject Headings

68T15, 68Q01

Email address

BibTex
RIS
TXT

@Article{CiCP-36-1090, author = {Wang , ZhiweiZhang , LuluZhang , Zhongwang and Xu , Zhi-Qin John}, title = {Loss Jump During Loss Switch in Solving PDEs with Neural Networks}, journal = {Communications in Computational Physics}, year = {2024}, volume = {36}, number = {4}, pages = {1090--1112}, abstract = {

}, issn = {1991-7120}, doi = {https://doi.org/10.4208/cicp.OA-2024-0096}, url = {http://global-sci.org/intro/article_detail/cicp/23487.html} }

TY - JOUR T1 - Loss Jump During Loss Switch in Solving PDEs with Neural Networks AU - Wang , Zhiwei AU - Zhang , Lulu AU - Zhang , Zhongwang AU - Xu , Zhi-Qin John JO - Communications in Computational Physics VL - 4 SP - 1090 EP - 1112 PY - 2024 DA - 2024/10 SN - 36 DO - http://doi.org/10.4208/cicp.OA-2024-0096 UR - https://global-sci.org/intro/article_detail/cicp/23487.html KW - Loss jump, frequency bias, neural network, loss switch. AB -

Wang , ZhiweiZhang , LuluZhang , Zhongwang and Xu , Zhi-Qin John. (2024). Loss Jump During Loss Switch in Solving PDEs with Neural Networks. Communications in Computational Physics. 36 (4). 1090-1112. doi:10.4208/cicp.OA-2024-0096

Copy to clipboard

BibteX RIS TXT

The citation has been copied to your clipboard

- LOGIN -

- E-mail verification -

- REGISTER -