【干货】本周AI领域值得关注的开源论文和项目分享！

原创

mb5fd86d5f5874e 2021-03-26 09:51:39 ©著作权

文章标签 java 文章分类 Java 后端开发

©著作权归作者所有：来自51CTO博客作者mb5fd86d5f5874e的原创作品，请联系作者获取转载授权，否则将追究法律责任

01 时尚推荐 Fashion Recommendation

该项目构建了一个端到端的大规模图像分类和对时尚图像的视觉推荐解决方案。更具体地说，模型可以学习图像中的重要区域，并基于这种语义相似性生成各种建议。

首先，使用基于ResNet的模型建立了服装图像分类模型。该模型的特征层可以捕获细粒度的语义服装特征，例如织物、衣服的样式和图案。然后，使用此功能，模型可以使用最近邻居搜索将相似的衣服推荐给输入图像。

数据集：

DeepFashion是一个大型服装数据库，在研究社区中非常流行。它包含超过800,000种多样的时尚图片，从摆放位置良好的商店图片到不受约束的消费者照片。

它带有丰富的服装信息信息，还包含超过300,000个跨位/跨域图像对。更具体地说，项目使用了DeepFashion属性预测子集中的图像。

它包含289,222个衣服图像，50个衣服类别和1,000个衣服属性。每个图像都由边界框和服装类型注释。

【干货】本周AI领域值得关注的开源论文和项目分享！_java

代码：

preprocessing.py: 用于预处理数据集；

hyper_parameters.py: 用于定义有关训练的所有超参数；

fashion_input.py: 用于在训练期间进一步预处理图像；

simple_resnet.py: 用于定义ResNet网络体系结构；

train_n_test.py: 作为主训练测试文件。

样本结果：

1、连衣裙类别

【干货】本周AI领域值得关注的开源论文和项目分享！_java_02

2、外套类别

【干货】本周AI领域值得关注的开源论文和项目分享！_java_03

3、女性衬衫类别

【干货】本周AI领域值得关注的开源论文和项目分享！_java_04

项目库：

https://github.com/khanhnamle1994/fashion-recommendation

medaCy：医学文本挖掘和信息提取

MedaCy是在spaCy上构建的文本处理和学习框架，用于支持闪电般的快速原型设计，培训和高预测性医学NLP模型的应用。

它旨在通过提供用于模型训练，预测和组织的实用程序来简化研究人员的工作流程，同时确保系统的可重复性。

特点包括：

1.用于医学命名实体识别的高度预测性，共享任务主导的开箱即用训练模型。
2.可定制的管道pipelines，带有详细的开发说明和文档。
3.允许设计可复制的NLP系统，以重现结果并鼓励模型分发，同时仍保留隐私。
4.NLP @ VCU领导并维护着积极的社区发展。
5.详细的API。

参考链接：

https://github.com/NLPatVCU/medaCy

PyPSA：电力系统分析的Python库

PyPSA是一个免费软件工具箱，用于模拟和优化现代电力系统，其中包括诸如具有单位承载量的常规发电机，风力和太阳能发电量可变，存储单元，与其他能源部门耦合以及交流和直流电混合网络等功能。

PyPSA旨在与大型网络和较长时间序列很好地扩展。

该项目由卡尔斯鲁厄理工学院自动化和应用信息学研究所的能源系统建模小组维护。该小组一直由亥姆霍兹协会（Helmholtz Association）资助，直到2024年。

以前的版本是由FIAS的可再生能源小组开发的，用于对CoNDyNet项目进行仿真，该项目由德国联邦教育与研究部（BMBF）资助，作为Stromnetze研究的一部分。

PyPSA可以计算：

1.静态潮流
2.线性最佳潮流
3.安全约束线性最优潮流
4.电力/能源系统总成本最低的投资优化

【干货】本周AI领域值得关注的开源论文和项目分享！_java_05

参考链接：

https://github.com/PyPSA/PyPSA

04 电力负荷预测 Electric Load Forecasting

研究生期间的电力负荷预测项目。数据取自德里网站的国家负荷调度中心，并且在项目过程中实现了多个时间序列算法。

模型实现

models文件夹包含在项目过程中实现的所有算法/模型：

前馈神经网络 FFNN.ipynb
简单移动平均 SMA.ipynb
加权移动平均 WMA.ipynb
简单指数平滑 SES.ipynb
Holts-Winters HW.ipynb
查分整合移动平均自回归 ARIMA.ipynb
循环神经网络 RNN.ipynb
长短期记忆神经网络 LSTM.ipynb
门控循环单元 GRU.ipyn

server文件夹包含django网络服务器代码，旨在显示已实现的算法并比较其性能。所有已实现的算法都已用于预测今天的德里电力负荷。其中：

aws_arima.py 根据最近一个月的数据拟合ARIMA模型，并预测每天的负载；

aws_rnn.py 使用RNN、LSTM、GRU拟合最近两个月的数据，并预测每天的负载；

aws_smoothing.py 使用SES，SMA，WMA拟合上个月的数据并预测每天的负载；

aws.py 每天运行上述三个脚本的调度程序；

pdq_search.py 用于根据最近一个月的数据对ARIMA模型的超参数进行网格搜索；

load_scrap.py 从SLDC网站中按日加载数据，并以csv格式存储；

wheather_scrap.py 从wunderground站点获取德里的数据并将其以csv格式存储。