（极好的机器学习案例）机器学习入门实操~~

由于我悟性不高，一般学习一个新的东西，对于初见的一些概念，很难理解其意。我总是喜欢先找个实实在在的例子，跟着跑一遍，看看流程、结果。然后再回过头来学习里面的种种算法和规则。我且称之为菜鸟学习法。我们不得不面对的是，现在机器学习、深度学习这些新的学习范式，已经闯入多个领域，也在颠覆这些领域。感觉就像当年VASP等成熟软件的兴起一样，主流的商业软件淘汰了很多自己写代码算做量子计算的学者。接下来，机器学

松鼠协会总动员

836人浏览 · 2023-01-05 22:51:38

松鼠协会总动员 · 2023-01-05 22:51:38 发布

菜鸟学习法

由于我悟性不高，一般学习一个新的东西，对于初见的一些概念，很难理解其意。我总是喜欢先找个实实在在的例子，跟着跑一遍，看看流程、结果。然后再回过头来学习里面的种种算法和规则。我且称之为菜鸟学习法。

我们不得不面对的是，现在机器学习、深度学习这些新的学习范式，已经闯入多个领域，也在颠覆这些领域。

感觉就像当年VASP等成熟软件的兴起一样，主流的商业软件淘汰了很多自己写代码算做量子计算的学者。接下来，机器学习的引入，各种新的软件也许马上会成为下一个“VASP”，手握资源的各路大佬都在抢占地盘。

抱歉，扯远了，我们回到学习机器学习的第一个阶段，代码测试：

案例链接

https://nbviewer.org/github/hackingmaterials/matminer_examples/blob/main/matminer_examples/machine_learning-nb/bulk_modulus.ipynb

数据集来源

数据来源于数据集 matminer，具体使用参考官网

https://hackingmaterials.lbl.gov/matminer

以及文档：

https://hackingmaterials.lbl.gov/matminer/dataset_summary.html

部分代码简单说明

1. 加载和处理数据集

from matminer.datasets.convenience_loaders import load_elastic_tensor
df = load_elastic_tensor()  # loads dataset in a pandas DataFrame object

显示数据的开头部分使用head方法

df.head()

显示数据的列

df.columns

去掉不需要的列

unwanted_columns = ["volume", "nsites", 
"compliance_tensor","elastic_tensor", 
"elastic_tensor_original", "K_Voigt",
"G_Voigt", "K_Reuss", "G_Reuss"]
df = df.drop(unwanted_columns, axis=1)## 去掉不需要的列
df.head() #此时再观察一下这个数据集

数据的描述性统计

df.describe()

2. 添加描述符（特征化）

组成成分的特征化

from matminer.featurizers.conversions import StrToComposition
df = StrToComposition().featurize_dataframe(df, "formula")
df.head()

3. 线性回归

4. 随机森林

参考

大师兄科研网

https://mp.weixin.qq.com/s/U99hAXOsNob1sgAehIED3A

库的安装

一般直接使用
pip install 库名
就可以安装对应的库，我在自己电脑测试，使用pip install 比conda install这个方法好用。

简洁版测试代码下载

链接：https://pan.quark.cn/s/3b550442f061

ChatGPT 快问快答

或者读者也可以在ChatGPT里快问快答的形式学习简单的案例，也是一个不错的尝试。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

πRL：基于流的VLA模型在线RL微调

DAMO开发者矩阵

大型视频规划器实现通用机器人控制

DAMO开发者矩阵

【机器人路径规划】基于四种最新算法（小龙虾优化算法COA、螳螂搜索算法MSA、红尾鹰算法RTH、霸王龙优化算法TROA）求解机器人路径规划

在当今机器人技术蓬勃发展的时代，机器人广泛应用于工业制造、物流配送、服务行业等众多领域。而机器人路径规划作为机器人自主导航的核心技术，直接关系到机器人执行任务的效率、能耗以及安全性。高效的路径规划能够使机器人快速、准确地到达目标位置，避免碰撞障碍物，从而提高整体工作效能。遗传算法、Dijkstra 算法和蚂蚁优化算法是路径规划领域常用的算法。遗传算法以其模拟生物进化的独特思想，具有较强的全局搜索能