网站首页 > java教程 正文
情景: 听说AI很火,DeepLearning很厉害,想来了解一下。于是满怀热情地打开一片文章。。。5分钟后,很快啊,就被各种概念、数学公式劝退了。想尝试运行一下代码,又被各种python、C++折磨。
工程思维习惯先跑起来再慢慢调试了解。为了顺利迈出第一步,接下来尝试用java & 小学概念来训练一个手写数字识别的DeepLearning模型。
完整代码: https://github.com/wangyuheng/my-first-deep-learning-model-by-java
背景
程序开发过程,其实是对现实的一种抽象,并翻译成电脑可以理解的语言,让电脑运行。
但是有些事物并不是那么确定且容易描述的,比如:如何向电脑描述图片中的数字?
我们可以一眼就识别出这个数字,但是没办法反推并描述这个过程。走一步算一步吧,先把代码写起来。
从程序开发角度,我们会定义一个接口函数,明确这个函数的输入、输出。
Integer recognition(Image img);
但是在实现函数时,感觉无从下手。这时就需要DeepLearning来帮助我们完成这个函数。可以认为模型就是这个函数的实现,而训练模型的过程就是编写(or 发现)这个函数。
概念
训练模型的过程是让DeepLearning去发现一个函数,我们需要描述这个函数长什么样。
数据集
首先,我们会定义这个模型的输入和输出。
图像大小为28x28,因为是灰度图,每个像素点只有黑白两种状态。用一个标识来描述处于某种状态,则模型的输入为一个大小为28x28的一维数组。预期的输出为数字识别,所以结果为0-9共10个数字,可以认为输出是一个大小为10的一维数组。
byte[10] recognition(byte[28*28] img);
因为不知道如何描述这个映射关系,所以我们采用了另一种方式: 并不定义实现,而是拿一些已有数据,让模型自己总结其中的规律。
比如,输入一个数字6的图片,告诉模型这张图片最终会映射为6。也就是说我们的输入包括两部分图像本身(Data)和表示的内容6(Label)。
在模型训练的过程中需要使用大量的数据(Data+Label),这一批数据称之为数据集(Dataset)。而数据集因为作用不同,又会被划分为
- 训练集
- 验证集
- 测试集
这3个概念非常符合我们的学习过程
- 训练集: 课堂教学。老师上课时为了描述1+1=2时,举的例子1个苹果+一个苹果,最终拿到2个苹果。
- 验证集: 课后作业。看一下学生的掌握情况,决定下一步的教学。同时为了避免学生过分背题(这还有一个高大上的名字叫做"过拟合"),导致只知道苹果+苹果,而不知道香蕉+香蕉。
- 测试集: 期末考试。为判断学生是否真正掌握了知识,用上课时未出现的题目进行测试。
神经网络
模型自己总结映射关系,可以认为是学习的概念,那深度的概念如何体现呢?经过实验发现,如果在输入、输出之间增加一些层(layer)进行映射,会得到更好的效果。增加的这些层被称为Hidden Layers,深度也就是指Hidden Layers的层数。
那么多少层会得到最好的效果呢?随缘吧。
并没有公式可以指导我们建立多少层,只能通过实验结果反证在什么样的layer可以获得好的效果。
代码
通过djl来帮助我们完成模型训练及使用
<dependency>
<groupId>ai.djl</groupId>
<artifactId>api</artifactId>
<version>${djl.version}</version>
</dependency>
Dataset
在数据制备阶段,通过图像Data的名称来描述Label,并放到相关文件目录下。
扫描文件目录进行加载,并提供Data+Label的获取方式
Train
按照输入输出,并设置2层hidden layers构成Block,将数据集以每次一张图片(Shape)的方式进行计算。
在性能检测中有一个Accuracy指标,表示的意思是 正确的数量/总数量 , 但是不能只依赖这个指标作为模型性能的判断。比如,我训练一个模型预测北京一年内某天是否会沙尘暴,如果这一年只有一天沙尘暴,而我的模型预测每一天都不会沙尘暴,那模型的Accuracy为364/365>99% 但显然这个模型是失败的。
inference
使用模型时,需要设定同样的Block,图像经过映射后会得到一个结果,但是并不会得到唯一解,而是获取多个结果及可能性比例。可以选择获取best
其他
模型学习的是知识,data和label之间要具备因果关系。比如:名字和是否能上清华之间存在关系吗?显然不,你不能训练一个模型来预测某个名字的人能否上清华。你还要加入生辰八字。。等等,我好像已经发现了一条致富之路,不说了,我要带着模型去摆摊了
猜你喜欢
- 2024-10-29 Java高级程序员(5年左右)面试题目集
- 2024-10-29 Java编程实现数字签名(java签名验签的做法)
- 2024-10-29 Java数组中重复的数字(java数组重组)
- 2024-10-29 Java控制台猜数字游戏(javaweb猜数字游戏)
- 2024-10-29 如何基于Java解析国密数字证书(java 国密算法库)
- 2024-10-29 Java修炼终极指南:22. 简要介绍Java中的(无)符号整数
- 2024-10-29 Java 枚举获取值和数字下标(java枚举类根据key获取value)
- 2024-10-29 关于数字的对齐原来这么简单(excel中数字的对齐方式)
- 2024-10-29 一文带你搞懂Java异常(java异常简单理解)
- 2024-10-29 入门java打卡第五天——number&math类
你 发表评论:
欢迎- 07-15采用Oracle OSB总线进行服务注册和接入
- 07-15javaEE 新闻管理系统 oracle11+tomcat6
- 07-15从Oracle演进看数据库技术的发展(oracle数据库发展史)
- 07-15如何升级oracle数据库安全补丁(oraclepsu补丁升级)
- 07-15【权威发布】关于Oracle WebLogic Server未授权远程代码执行高危漏洞的预警通报
- 07-15【mykit-data】 数据库同步工具(数据库表同步工具)
- 07-15[Java速成] 数据库基础,Connector/J、JDBC、JPA的关系(day 7)
- 07-15Google前工程主管“入住”Oracle(google浏览器找不到以前的书签)
- 最近发表
-
- 采用Oracle OSB总线进行服务注册和接入
- javaEE 新闻管理系统 oracle11+tomcat6
- 从Oracle演进看数据库技术的发展(oracle数据库发展史)
- 如何升级oracle数据库安全补丁(oraclepsu补丁升级)
- 【权威发布】关于Oracle WebLogic Server未授权远程代码执行高危漏洞的预警通报
- 【mykit-data】 数据库同步工具(数据库表同步工具)
- [Java速成] 数据库基础,Connector/J、JDBC、JPA的关系(day 7)
- Google前工程主管“入住”Oracle(google浏览器找不到以前的书签)
- Oracle数据库云服务系列新增前所未有的企业级功能
- 直播预告丨如何实现Oracle存储过程到java的一键转化
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)