您犯了两个非常基本的错误:
- 您的超简单模型(具有单个单元的单层网络)根本不符合神经网络的条件,更不用说“深度学习”了(因为您的问题已被标记)
- 同样,您的数据集(仅20个样本)也非常小
当然可以理解的是,如果神经网络要解决问题,甚至要像“简单”那样
x*x,就必须具有一定的复杂性。而当它们充满大型训练数据集时,它们真正发挥作用的地方。
尝试求解此类函数逼近的方法不仅是列出(少数可能的)输入,然后将其与所需的输出一起输入模型。请记住,NN是通过示例而不是通过符号推理来学习的。例子越多越好。在类似情况下,我们通常要做的是生成大量示例,然后将它们提供给模型进行训练。
话虽如此,这是Keras中一个三层神经网络的简单演示,用于近似函数
x*x,使用输入的10,000个随机数作为输入
[-50, 50]:
import numpy as npimport kerasfrom keras.models import Sequentialfrom keras.layers import Densefrom keras.optimizers import Adamfrom keras import regularizersimport matplotlib.pyplot as pltmodel = Sequential()model.add(Dense(8, activation='relu', kernel_regularizer=regularizers.l2(0.001), input_shape = (1,)))model.add(Dense(8, activation='relu', kernel_regularizer=regularizers.l2(0.001)))model.add(Dense(1))model.compile(optimizer=Adam(),loss='mse')# generate 10,000 random numbers in [-50, 50], along with their squaresx = np.random.random((10000,1))*100-50y = x**2# fit the model, keeping 2,000 samples as validation sethist = model.fit(x,y,validation_split=0.2, epochs= 15000, batch_size=256)# check some predictions:print(model.predict([4, -4, 11, 20, 8, -5]))# result:[[ 16.633354] [ 15.031291] [121.26833 ] [397.78638 ] [ 65.70035 ] [ 27.040245]]
好吧,还不错!请记住,神经网络是函数 逼近 :我们应该期待他们既不 准确 再现功能关系也不是“知道”的结果
4,并
-4应该是相同的。
让我们生成一些新的随机数据
[-50,50](记住,出于所有实际目的,这些都是模型中 看不见的 数据),并将它们与原始数据一起绘制以得到更一般的图片:
plt.figure(figsize=(14,5))plt.subplot(1,2,1)p = np.random.random((1000,1))*100-50 # new random data in [-50, 50]plt.plot(p,model.predict(p), '.')plt.xlabel('x')plt.ylabel('prediction')plt.title('Predictions on NEW data in [-50,50]')plt.subplot(1,2,2)plt.xlabel('x')plt.ylabel('y')plt.plot(x,y,'.')plt.title('Original data')
结果:
好吧,可以说它确实确实看起来像是一个很好的近似…
您也可以在此线程中查看正弦近似值。
最后要记住的是,尽管即使使用相对简单的模型也能获得不错的近似值,但我们 不 应该期望的是 外推法 ,即外部良好的性能
[-50,50];有关详细信息,请参阅我的答案:深度学习是否适合在培训范围之外安装简单的非线性函数?
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)