厉害了!竟然有程序员在GitHub上建了一个新华词典数据库

厉害了!竟然有程序员在GitHub上建了一个新华词典数据库,第1张

今天,给大家推荐一个GitHub上的一个热门项目——chinese-xinhua ,一个新华字典数据库,截至今日,该项目已经获得了 8200+ 个「star」以及 1900+ 个「fork」。可能是知道的太少了

这个数据库收录了包括14032条歇后语,16142个汉字,31648个成语。(GitHub项目地址: https://github.com/pwxcoo/chinese-xinhua )

该数据库的所有数据都放在data/ 目录,对性能没需求的话,可以直接使用作者的新华字典 API 。下面,我们一起来详细了解一下这个数据库

项目结构

该数据库的项目结构如下:

数据库介绍

成语

词语

汉字

API接口

GET、POST均可,返回数据格式为JSON。下面将以GET做示例

直接请求 成语 ,则需要两个参数:

type=idiom 表示需要请求成语

word=兴高采烈 表示请求的成语

示例,如请求兴高采烈的成语,返回结果如下:

当你请求的是成语时,返回的结果包括:成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。

直接请求 拼音首字母缩写 ,需要两个参数:

type=idiom 表示需要请求成语

word=xgcl 表示请求的成语拼音首字母缩写

请求 歇后语 ,同样需要两个参数

type=xiehouyu 表示需要请求歇后语

riddle=王婆 表示请求的歇后语的语面。可以模糊匹配

请求歇后语,结果会返回带有你输入的关键词的所有歇后语。

请求 汉字 ,需要两个参数

type=word 表示需要请求汉字

word=吴 表示请求的是

感兴趣的可以到GitHub上看看,果然是最怕程序员有文化。

自从美国从去年逐渐加大对中国科技企业的打压之后, “ 掌握核心技术 ” 就已经上升成为了一项全民级别的饭后议题。

像是其中光刻机、芯片设计一类的高精尖技术,光是咱们差评就已经跟大家用文章和视频掰开揉碎聊过无数回了。

所以大多数小伙伴的心里可能已经有数了 —— 硬件这一块投入大,产出慢。我们只能是丢掉幻想,准备斗争。

不过相比起难啃的硬件,最近有消息说,我们的软件行业可能要开花了。

理由是前一阵,工信部公布了 “ 2020 年开源托管平台项目 ” 的招标结果。

其中决定,把码云( Gitee )提升为 “ 面向中国的独立开放源代码托管平台 ” 。也就是所谓的国家队。

上面这句话里的工信部是啥我们都知道。手机不能换套餐、网络账号不能注销、恶意扣费、网络诈骗。。。凡是和信息技术有关的,找工信部投诉准没错。

可是这个 “ 码云 ” 和 “ 开放源代码托管平台 ” 是个啥?

。。。。。。

经常看咱们差评文章的小伙伴应该知道差评君有个业余爱好是撸代码,其中不少次在介绍和代码有关的故事时都提到了一个网站。

那个网站的名字叫 “ GitHub ” 。

GitHub 就是一个 “ 开放源代码托管平台 ” 。不仅如此,它还是全球最大的开源代码托管平台。

每天,无数程序员都会把自己写的代码上传到 GitHub 中,避免哪天因为电脑坏了导致全盘 GG 。

所以开放源代码托管平台就是个用来存代码的百度网盘?

不不不,这个托管平台更像是一个公共大广场 —— 假如说我往 GitHub 上传了一段程序代码,那么 GitHub 上的所有用户都能搜到这段代码。

不需要什么查看授权,也不需要什么提取码,看别人的代码就跟逛花展一样,随随便便。

如何分析Github上的代码,这是一个非常好的问题。

首先,Github作为全球最大的代码托管平台,好多开源项目都托管在上面比如著名的spring框架,mybatis框架等等。

那么如何分析和学习Github上的代码呢?我觉得主要应该从以下3点入手!

第一点:找准适合自己的开源项目。

第二点:将代码clone到本地。

第三点:抓主干,做总结。

首先,作为一名技术人员,应该非常清楚自己的技术水平在怎样的一个层次。

以Java为例,Gibhub上好多优秀的框架或者开源项目,一定用到了许多设计模式或者精炼干练的代码风格,看懂这些代码你就需要有一定的技术沉淀,否则新手小白肯定是会被打消积极性的。因此给自己的技术水平先做一个简单分析,找一些自己比较合适的开源代码去研究,或者让高手给你推荐一些开源项目,再展开钻研代码的工作。

其次,Github上的代码毕竟是通过浏览器访问浏览的,因此不会有非常强大的 *** 作功能,将代码clone到本地会大大增加代码的可读性!

最后,任何代码都不可能记住每一个细节,因此一定要抓主干,理清脉络。我的建议是最好进行博客形式的原理性总结,把源码中的实现过程,比较巧妙的地方进行归纳和总结,防止遗忘。

总的来说,Github上的源码还是应该比较适合一些工作3到5年的程序员进行深入研究,不建议新手小白直接看框架或者开源项目源码,这样只会打消学习的热情!

希望我的观点可以帮助到你!


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12096998.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存