您现在的位置是:课程教程文章
python实现信息熵的计算代码
2023-12-14 22:30课程教程文章 人已围观
-
Python自动化测开+Java自动化测开+双语测试
Python自动化测开+Java自动化测开+双语测试学习资料领取、VIP课报名咨询、加微dingyu-001 注:如果是苹果系统,请不要充值... -
Python程序设计
Python程序设计本课程通过对程序设计基本方法、Python语言的语法、Python语言多领域应用等知识... -
零基础学习Python制作ArcGIS自定义工具
零基础学习Python制作ArcGIS自定义工具 使用Python语言进行ArcGIS开发,主要是借助ArcGIS提供的arcpy站点包进行地理数... -
Python零基础机器学习
Python零基础机器学习【开发课程目的】 随着人工智能时代到来,人们的工作、生活和学习方式将发...
1、什么是信息熵?
1948年香农提出了信息熵(Entropy)的概念。
信息理论:
1、从信息的完整性上进行的描述:
当系统的有序状态一致时,数据越集中的地方熵值越小,数据越分散的地方熵值越大。
2、从信息的有序性上进行的描述:
当数据量一致时,系统越有序,熵值越低;系统越混乱或者分散,熵值越高。
“信息熵” (information entropy)是度量样本集合纯度最常用的一种指标。
二、python实现信息熵的计算代码
1、导入库
import numpy as np import pandas as pd
2、 准备数据
data = pd.DataFrame( {'学历': ['专科', '专科', '专科', '专科', '专科', '本科', '本科', '本科', '本科', '本科', '研究生', '研究生', '研究生', '研究生', '研究生'], '婚否': ['否', '否', '是', '是', '否', '否', '否', '是', '否', '否', '否', '否', '是', '是', '否'], '是否有车': ['否', '否', '否', '是', '否', '否', '否', '是', '是', '是', '是', '是', '否', '否', '否'], '收入水平': ['中', '高', '高', '中', '中', '中', '高', '高', '很高', '很高', '很高', '高', '高', '很高', '中'], '类别': ['否', '否', '是', '是', '否', '否', '否', '是', '是', '是', '是', '是', '是', '是', '否']})
3、定义信息熵函数
# 定义计算信息熵的函数:计算Infor(D) def infor(data): a = pd.value_counts(data) / len(data) return sum(np.log2(a) * a * (-1))
4、数据测试
# print(infor(data["学历"])) #测试结果为: 1.584962500721156课程教程:python实现信息熵的计算代码
下一篇:没有了