linux sysfs 创建文件里头哪个是设置cpu是否online的

梦幻西游电脑版 | 三国人物 | 网络推广 | 剑侠情缘网络版叁 | 武侠 | 总决赛 | Legion | 牛魔王 | 游戏策划 | unity（游戏引擎） | Xbox One | 电子技术研发 | 高中 | 街机游戏 | 钢铁雄心4 | iOS应用 | 海贼王 | 桌面游戏 | 一体机 | 冬奥会 | 校服 | 数学建模 | 秦时明月之天行九歌 | 陶渊明 | 营销策划 | 洛奇英雄传 | 极限挑战(综艺节目) | Overlord（动画） | galgame | 热血传奇（游戏） | 掌上游戏机 | ps3 | ios游戏 | 春节联欢晚会 | 室内设计 | 任天堂 | 对联 | 杨紫 | 公积金 | 进击的巨人 | 休闲游戏 | 算法 | 搜狗输入法 | 超级机器人大战 | 书法 | 化妆品 | 游戏手柄 | 西瓜视频 | 歌曲 | O2O | 彩虹六号（游戏） | 字幕 | 配音 | 男性 | 天下2（游戏） | 衣服 | 日本漫画 | 虎牙直播 | 中国中央电视台 | 梦三国（游戏） | HTML | 经济学 | 300英雄 | 免费软件 | 斗鱼直播 | 刀塔（dota2） | 高中英语 | 命令与征服：红色警戒2（游戏） | Flash | 命运-冠位指定 | 冷知识 | 智能眼镜 | 川酒 | 网站运营 | Internet Explorer | 火影忍者手游 | acg | 火柴人系列游戏 | 任天堂wii | 啤酒 | 一级方程式赛车（f1） | 流星 | 街头霸王（游戏） | 格斗游戏（ftg） | 导航 | 孙悟空 | 女生 | 完美世界（游戏） | 手机游戏开发 | 游戏攻略 | 英雄传说：闪之轨迹（游戏） | 食物 | 任天堂3ds | 超级战队 | 微软（microsoft） | 演员 | youtube | 小米科技 | 花千骨 | 记忆 | 日历 | 刺客信条2 | 哔哩哔哩 | 花样姐姐 | 农业 | 生死狙击手游 | 身高 | 酒吧 | 任天堂switch | 香水推荐 | 编辑器 | 用户界面 | QQ飞车（游戏） | pdf | 飞船 | 勇者斗恶龙（游戏） | 星际战甲（游戏） | 整容 | 流氓软件 | 金庸 | 优酷视频 | 面相 | 生存游戏 | 笔记本 | 华为路由器 | 动画制作 | 网吧 | 软件开发 | macos | 移民 | 烹饪 | 天蝎座 | 意大利 | 赛车游戏 | 雷欧奥特曼 | 香水 | 冰雪奇缘（电影） | 微信群 | 背景音乐（bgm） | 李信 | 刺客信条起源 | 中药 | 炉石传说 | 凹凸世界 | 男生 | 率土之滨 | 祛痘 | 人生 | 辐射防护 | 即时战略游戏（RTS） | 乌贼 | 名言 | 网址导航 | ansys | 输入法 | 海南 | 李小龙 | 武侠小说 | 食用油 | 最强大脑（电视节目） | 飙酷车神 | 海关 | 扫雷（游戏） | 仙剑 | 大话西游之大圣娶亲（电影） | 网球 | 闺蜜 | 科学 | NBA 2K | 战神（游戏） | 取名 | 龙之谷（游戏） | 巧克力 | 球球大作战 | 乐器 | 英雄无敌3（游戏） | 酵素 | 尧山 | root | 李白 | 猴子 | 缝纫机 | 花卉 | 最终幻想（游戏） | 舰队 collection | 星系 | 美术 | 足球游戏 | 新剑侠情缘 | mugen | 中国 | 日本代购 | 南昌市 | 暴雪游戏 | 生化危机7 | 饥荒（游戏） | 孤岛惊魂5（游戏） | 画师 | 地图应用 | 仁王（游戏） |

你的位置：网站首页 >> 频道首页 >>游戏 >>linux sysfs 创建文件里头哪个是设置cpu是否online的

linux sysfs 创建文件里头哪个是设置cpu是否online的

来源：蜘蛛抓取(WebSpider) 时间：2015-09-22 01:31 标签： sysfs

6926人阅读
在上一篇文章中，介绍了cpufreq的core层，core提供了cpufreq系统的初始化，公共数据结构的建立以及对cpufreq中其它子部件提供注册功能。core的最核心功能是对policy的管理，一个policy通过cpufreq_policy结构中的governor字段，和某个governor相关联，本章的内容正是要对governor进行讨论。
/*****************************************************************************************************/
声明：本博内容均由http://blog.csdn.net/droidphone原创，转载请注明出处，谢谢！
/*****************************************************************************************************/
通过前面两篇文章的介绍，我们知道，governor的作用是：检测系统的负载状况，然后根据当前的负载，选择出某个可供使用的工作频率，然后把该工作频率传递给cpufreq_driver，完成频率的动态调节。内核默认提供了5种governor供我们使用，在之前的内核版本中，每种governor几乎是独立的代码，它们各自用自己的方式实现对系统的负载进行监测，很多时候，检测的逻辑其实是很相似的，各个governor最大的不同之处其实是根据检测的结果，选择合适频率的策略。所以，为了减少代码的重复，在我现在分析的内核版本中（3.10.0），一些公共的逻辑代码被单独抽象出来，单独用一个文件来实现：/drivers/cpufreq/cpufreq_governor.c，而各个具体的governor则分别有自己的代码文件，如：cpufreq_ondemand.c，cpufreq_performance.c。下面我们先从公共部分讨论。
1. &数据结构
cpu_dbs_common_info& 该结构把对计算cpu负载需要使用到的一些辅助变量整合在了一起，通常，每个cpu都需要一个cpu_dbs_common_info结构体，该结构体中的成员会在governor的生命周期期间进行传递，以用于统计当前cpu的负载，它的定义如下：
/* Per cpu structures */
struct cpu_dbs_common_info {
u64 prev_cpu_
u64 prev_cpu_
u64 prev_cpu_
struct cpufreq_policy *cur_
struct delayed_
struct mutex timer_
ktime_t time_
cpu &与该结构体相关联的cpu编号。prev_cpu_idle &上一次统计时刻该cpu停留在idle状态的总时间。prev_cpu_wall &上一次统计时刻对应的总工作时间。cur_policy &指向该cpu所使用的cpufreq_policy结构。work &工作队列，该工作队列会被定期地触发，然后定期地进行负载的更新和统计工作。
dbs缩写，实际是：demand based switching，通常，因为cpu_dbs_common_info只包含了经过抽象后的公共部分，所以，各个governor会自己定义的一个包含cpu_dbs_common_info的自定义结构，例如对于ondemand，他会定义：
struct od_cpu_dbs_info_s {
struct cpu_dbs_common_
struct cpufreq_frequency_table *freq_
unsigned int freq_
unsigned int freq_lo_
unsigned int freq_hi_
unsigned int rate_
unsigned int sample_type:1;
};而对于Conservative，他的定义如下：
struct cs_cpu_dbs_info_s {
struct cpu_dbs_common_
unsigned int down_
unsigned int requested_
unsigned int enable:1;
};把它理解为类似于C++语言的基类和子类的概念就是了。
common_dbs_data & &各个独立的governor，需要和governor的公共层交互，需要实现一套公共的接口，这个接口由common_dbs_data结构来提供：
struct common_dbs_data {
/* Common across governors */
#define GOV_ONDEMAND
#define GOV_CONSERVATIVE
struct attribute_group *attr_group_gov_ /* one governor - system */
struct attribute_group *attr_group_gov_ /* one governor - policy */
/* Common data for platforms that don't set have_governor_per_policy */
struct dbs_data *gdbs_
struct cpu_dbs_common_info *(*get_cpu_cdbs)(int cpu);
void *(*get_cpu_dbs_info_s)(int cpu);
void (*gov_dbs_timer)(struct work_struct *work);
void (*gov_check_cpu)(int cpu, unsigned int load);
int (*init)(struct dbs_data *dbs_data);
void (*exit)(struct dbs_data *dbs_data);
/* Governor specific ops, see below */
void *gov_
};主要的字段意义如下：
governor &因为ondemand和conservative的实现部分有很多相似的地方，用该字段做一区分，可以设置为GOV_ONDEMAND或GOV_CONSERVATIVE的其中之一。attr_group_gov_sys &该公共的sysfs属性组。
attr_group_gov_pol &各policy使用的属性组，有时候多个policy会使用同一个governor算法。
gdbs_data &通常，当没有设置have_governor_per_policy时，表示所有的policy使用了同一种governor，该字段指向该governor的dbs_data结构。
get_cpu_cdbs &回调函数，公共层用它取得对应cpu的cpu_dbs_common_info结构指针。get_cpu_dbs_info_s &回调函数，公共层用它取得对应cpu的cpu_dbs_common_info_s的派生结构指针，例如：od_cpu_dbs_info_s，cs_cpu_dbs_info_s。
gov_dbs_timer &前面说过，cpu_dbs_common_info_s结构中有一个工作队列，该回调通常用作工作队列的工作函数。
gov_check_cpu &计算cpu负载的回调函数，通常会直接调用公共层提供的dbs_check_cpu函数完成实际的计算工作。
init & 初始化回调，用于完成该governor的一些额外的初始化工作。
exit &回调函数，governor被移除时调用。
gov_ops &各个governor可以用该指针定义各自特有的一些操作接口。
dbs_data & &该结构体通常由governor的公共层代码在governor的初始化阶段动态创建，该结构的一个最重要的字段就是cdata：一个common_dbs_data结构指针，另外，该结构还包含一些定义governor工作方式的一些调节参数。该结构的详细定义如下：
struct dbs_data {
struct common_dbs_data *
unsigned int min_sampling_
int usage_
/* dbs_mutex protects dbs_enable in governor start/stop */
几个主要的字段：
cdata &一个common_dbs_data结构指针，通常由具体governor的实现部分定义好，然后作为参数，通过公共层的API：cpufreq_governor_dbs，传递到公共层，cpufreq_governor_dbs函数在创建好dbs_data结构后，把该指针赋值给该字段。
min_sampling_rate &用于记录统计cpu负载的采样周期。
usage_count &当没有设置have_governor_per_policy时，意味着所有的policy采用同一个governor，该字段就是用来统计目前该governor被多少个policy引用。
tuners &指向governor的调节参数结构，不同的governor可以定义自己的tuner结构，公共层代码会在governor的初始化阶段调用common_dbs_data结构的init回调函数，governor的实现可以在init回调中初始化tuners字段。
如果设置了have_governor_per_policy，每个policy拥有各自独立的governor，也就是说，拥有独立的dbs_data结构，它会记录在cpufreq_policy结构的governor_data字段中，否则，如果没有设置have_governor_per_policy，多个policy共享一个governor，和同一个dbs_data结构关联，此时，dbs_data被赋值在common_dbs_data结构的gdbs_data字段中。
cpufreq_governor &这个结构在本系列文章的第一篇已经介绍过了，请参看。几个数据结构的关系如下图所示：
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & &图 1.1 &governor的数据结构关系
下面我们以ondemand这个系统已经实现的governor为例，说明一下如何实现一个governor。具体的代码请参看：/drivers/cpufreq/cpufreq_ondemand.c。
2. &定义一个governor
要实现一个governor，首先要定义一个cpufreq_governor结构，对于ondeman来说，它的定义如下：
struct cpufreq_governor cpufreq_gov_ondemand = {
= &ondemand&,
= od_cpufreq_governor_dbs,
.max_transition_latency = TRANSITION_LATENCY_LIMIT,
= THIS_MODULE,
};其中，governor是这个结构的核心字段，cpufreq_governor注册后，cpufreq的核心层通过该字段操纵这个governor的行为，包括：初始化、启动、退出等工作。现在，该字段被设置为od_cpufreq_governor_dbs，我们看看它的实现：
static int od_cpufreq_governor_dbs(struct cpufreq_policy *policy,
unsigned int event)
return cpufreq_governor_dbs(policy, &od_dbs_cdata, event);
}只是简单地调用了governor的公共层提供的API：cpufreq_governor_dbs，关于这个API，我们在后面会逐一进行展开，这里我们注意到参数：&od_dbs_cdata，正是我们前面讨论过得common_dbs_data结构，作为和governor公共层的接口，在这里它的定义如下：
static struct common_dbs_data od_dbs_cdata = {
.governor = GOV_ONDEMAND,
.attr_group_gov_sys = &od_attr_group_gov_sys,
.attr_group_gov_pol = &od_attr_group_gov_pol,
.get_cpu_cdbs = get_cpu_cdbs,
.get_cpu_dbs_info_s = get_cpu_dbs_info_s,
.gov_dbs_timer = od_dbs_timer,
.gov_check_cpu = od_check_cpu,
.gov_ops = &od_ops,
.init = od_init,
.exit = od_exit,
};这里先介绍一下get_cpu_cdbs和get_cpu_dbs_info_s这两个回调，前面介绍cpu_dbs_common_info_s结构的时候已经说过，各个governor需要定义一个cpu_dbs_common_info_s结构的派生结构，对于ondemand来说，这个派生结构是：od_cpu_dbs_info_s。两个回调函数分别用来获得基类和派生类这两个结构的指针。我们先看看od_cpu_dbs_info_s是如何定义的：
static DEFINE_PER_CPU(struct od_cpu_dbs_info_s, od_cpu_dbs_info);没错，它被定义为了一个per_cpu变量，也就是说，每个cpu拥有各自独立的od_cpu_dbs_info_s，这很正常，因为每个cpu需要的实时负载是不一样的，需要独立的上下文变量来进行负载的统计。前面也已经列出了od_cpu_dbs_info_s的声明，他的第一个字段cdbs就是一个cpu_dbs_common_info_s结构。内核为我们提供了一个辅助宏来帮助我们定义get_cpu_cdbs和get_cpu_dbs_info_s这两个回调函数：
#define define_get_cpu_dbs_routines(_dbs_info)
static struct cpu_dbs_common_info *get_cpu_cdbs(int cpu)
return &per_cpu(_dbs_info, cpu).
static void *get_cpu_dbs_info_s(int cpu)
return &per_cpu(_dbs_info, cpu);
所以，在cpufreq_ondemand.c中，我们只要简单地使用上述的宏即可定义这两个回调：
define_get_cpu_dbs_routines(od_cpu_dbs_info);经过上述这一系列的定义以后，governor的公共层即可通过这两个回调获取各个cpu所对应的cpu_dbs_common_info_s和od_cpu_dbs_info_s的结构指针，用来记录本次统计周期的一些上下文参数（idle时间和运行时间等等）。
3. &初始化一个governor
当一个governor被policy选定后，核心层会通过__cpufreq_set_policy函数对该cpu的policy进行设定，参看中的第4节和图4.1。如果policy认为这是一个新的governor（和原来使用的旧的governor不相同），policy会通过__cpufreq_governor函数，并传递CPUFREQ_GOV_POLICY_INIT参数，而__cpufreq_governor函数实际上是调用cpufreq_governor结构中的governor回调函数，在第2节中我们已经知道，这个回调最后会进入governor公共API：cpufreq_governor_dbs，下面是它收到CPUFREQ_GOV_POLICY_INIT参数时，经过简化后的代码片段：
case CPUFREQ_GOV_POLICY_INIT:
dbs_data = kzalloc(sizeof(*dbs_data), GFP_KERNEL);
dbs_data-&cdata =
dbs_data-&usage_count = 1;
rc = cdata-&init(dbs_data);
rc = sysfs_create_group(get_governor_parent_kobj(policy),
get_sysfs_attr(dbs_data));
policy-&governor_data = dbs_
/* Bring kernel and HW constraints together */
dbs_data-&min_sampling_rate = max(dbs_data-&min_sampling_rate,
MIN_LATENCY_MULTIPLIER * latency);
set_sampling_rate(dbs_data, max(dbs_data-&min_sampling_rate,
latency * LATENCY_MULTIPLIER));
if ((cdata-&governor == GOV_CONSERVATIVE) &&
(!policy-&governor-&initialized)) {
struct cs_ops *cs_ops = dbs_data-&cdata-&gov_
cpufreq_register_notifier(cs_ops-&notifier_block,
CPUFREQ_TRANSITION_NOTIFIER);
if (!have_governor_per_policy())
cdata-&gdbs_data = dbs_
首先，它会给这个policy分配一个dbs_data实例，然后把通过参数cdata传入的common_dbs_data指针，赋值给它的cdata字段，这样，policy就可以通过该字段获得governor的操作接口（通过cdata的一系列回调函数）。然后，调用cdata的init回调函数，对这个governor做进一步的初始化工作，对于ondemand来说，init回调的实际执行函数是：od_init，主要是完成和governor相关的一些调节参数的初始化，然后把初始化好的od_dbs_tuners结构指针赋值到dbs_data的tuners字段中，它的详细代码这里就不贴出了。接着，通过sysfs_create_group函数，建立该governor在sysfs中的节点，以后我们就可以通过这些节点对该governor的算法逻辑进行微调，ondemand在我的电脑中，建立了以下这些节点（sys/devices/system/cpu/cpufreq/ondemand）：
sampling_down_
powersave_
sampling_rate_
继续，把初始化好的dbs_data结构赋值给policy的governor_data字段，以方便以后的访问。最后是通过set_sampling_rate设置governor的采样周期，如果还有设置have_governor_per_policy，把dbs_data结构指针赋值给cdata结构的gdbs_data字段，至此，governor的初始化工作完成，下面是整个过程的序列图：
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & 图 3.1 &governor的初始化
4. &启动一个governor
核心层会通过__cpufreq_set_policy函数，通过CPUFREQ_GOV_POLICY_INIT参数，在公共层的API：cpufreq_governor_dbs中，完成了对governor的初始化工作，紧接着，__cpufreq_set_policy会通过CPUFREQ_GOV_START参数，和初始化governor的流程一样，最终会到达cpufreq_governor_dbs函数中，我们看看它是如何启动一个governor的：
case CPUFREQ_GOV_START:
if (!policy-&cur)
return -EINVAL;
mutex_lock(&dbs_data-&mutex);
for_each_cpu(j, policy-&cpus) {
struct cpu_dbs_common_info *j_cdbs =
dbs_data-&cdata-&get_cpu_cdbs(j);
j_cdbs-&cpu =
j_cdbs-&cur_policy =
j_cdbs-&prev_cpu_idle = get_cpu_idle_time(j,
&j_cdbs-&prev_cpu_wall, io_busy);
if (ignore_nice)
j_cdbs-&prev_cpu_nice =
kcpustat_cpu(j).cpustat[CPUTIME_NICE];
mutex_init(&j_cdbs-&timer_mutex);
INIT_DEFERRABLE_WORK(&j_cdbs-&work,
dbs_data-&cdata-&gov_dbs_timer);
首先，遍历使用该policy的所有的处于online状态的cpu，针对每一个cpu，做以下动作：
取出该cpu相关联的cpu_dbs_common_info结构指针，之前已经讨论过，governor定义了一个per_cpu变量来定义各个cpu所对应的cpu_dbs_common_info结构，通过common_dbs_data结构的回调函数可以获取该结构的指针。初始化cpu_dbs_common_info结构的cpu，cur_policy，prev_cpu_idle，prev_cpu_wall，prev_cpu_nice字段，其中，prev_cpu_idle，prev_cpu_wall这两个字段会被以后的负载计算所使用。为每个cpu初始化一个工作队列，工作队列的执行函数是common_dbs_data结构中的gov_dbs_timer字段所指向的回调函数，对于ondemand来说，该函数是：od_dbs_timer。这个工作队列会被按照设定好的采样率定期地被唤醒，进行cpu负载的统计工作。
然后，记录目前的时间戳，调度初始化好的工作队列在稍后某个时间点运行：
/* Initiate timer time stamp */
cpu_cdbs-&time_stamp = ktime_get();
gov_queue_work(dbs_data, policy,
delay_for_sampling_rate(sampling_rate), true);
下图表达了启动一个governor的过程：
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & &图 4.1 &启动一个governor
工作队列被调度执行后，会在工作队列的执行函数中进行cpu负载的统计工作，这个我们在下一节中讨论。
5. &系统负载的检测
上一节我们提到，核心层启动一个governor后，会在每个使用该governor的cpu上建立一个工作队列，工作队列的执行函数是在common_dbs_data中gov_dbs_timer字段所指向的函数，理所当然，该函数由各个governor的具体代码来实现，对于ondemand governor，它的实现函数是od_dbs_timer。governor的公共层代码为我们提供了一个API：dbs_check_cpu，该API用来计算两个统计周期期间某个cpu的负载情况，我们先分析一下dbs_check_cpu：
void dbs_check_cpu(struct dbs_data *dbs_data, int cpu)
struct cpu_dbs_common_info *cdbs = dbs_data-&cdata-&get_cpu_cdbs(cpu);
policy = cdbs-&cur_
/* Get Absolute Load (in terms of freq for ondemand gov) */
for_each_cpu(j, policy-&cpus) {
struct cpu_dbs_common_info *j_
j_cdbs = dbs_data-&cdata-&get_cpu_cdbs(j);
cur_idle_time = get_cpu_idle_time(j, &cur_wall_time, io_busy);
wall_time = (unsigned int)
(cur_wall_time - j_cdbs-&prev_cpu_wall);
j_cdbs-&prev_cpu_wall = cur_wall_
idle_time = (unsigned int)
(cur_idle_time - j_cdbs-&prev_cpu_idle);
j_cdbs-&prev_cpu_idle = cur_idle_
load = 100 * (wall_time - idle_time) / wall_
load *= cur_freq；
/* 实际的代码不是这样，为了简化讨论，精简为实际的计算逻辑*/
if (load & max_load)
max_load =
dbs_data-&cdata-&gov_check_cpu(cpu, max_load);
}由代码可以看出，遍历该policy下每个online的cpu，取出该cpu对应的cpu_dbs_common_info结构，该结构中的prev_cpu_idle和prev_cpu_wall保存有上一次采样周期时记录的idle时间和运行时间，负载的计算其实很简单：
idle_time = 本次idle时间 - 上次idle时间；wall_time = 本次总运行时间 - 上次总运行时间；负载load = 100 * （wall_time - idle_time）/ wall_time；把所有cpu中，负载最大值记入max_load中，作为选择频率的依据；
计算出最大负载max_load后，调用具体governor实现的gov_check_cpu回调函数，对于ondemand来说，该回调函数是：od_check_cpu，我们跟进去看看：
static void od_check_cpu(int cpu, unsigned int load_freq)
struct od_cpu_dbs_info_s *dbs_info = &per_cpu(od_cpu_dbs_info, cpu);
struct cpufreq_policy *policy = dbs_info-&cdbs.cur_
struct dbs_data *dbs_data = policy-&governor_
struct od_dbs_tuners *od_tuners = dbs_data-&
dbs_info-&freq_lo = 0;
/* Check for frequency increase */
if (load_freq & od_tuners-&up_threshold * policy-&cur) {
/* If switching to max speed, apply sampling_down_factor */
if (policy-&cur & policy-&max)
dbs_info-&rate_mult =
od_tuners-&sampling_down_
dbs_freq_increase(policy, policy-&max);
}当负载比预设的阀值高时（od_tuners-&up_threshold，默认值是95%），立刻选择该policy最大的工作频率作为接下来的工作频率。如果负载没有达到预设的阀值，但是当前频率已经是最低频率了，则什么都不做，直接返回：
if (policy-&cur == policy-&min)
运行到这里，cpu的频率可能已经在上面的过程中被设置为最大频率，实际上我们可能并不需要这么高的频率，所以接着判断，当负载低于另一个预设值时，这时需要计算一个合适于该负载的新频率：
if (load_freq & od_tuners-&adj_up_threshold
* policy-&cur) {
unsigned int freq_
freq_next = load_freq / od_tuners-&adj_up_
/* No longer fully busy, reset rate_mult */
dbs_info-&rate_mult = 1;
if (freq_next & policy-&min)
freq_next = policy-&
if (!od_tuners-&powersave_bias) {
__cpufreq_driver_target(policy, freq_next,
CPUFREQ_RELATION_L);
freq_next = od_ops.powersave_bias_target(policy, freq_next,
CPUFREQ_RELATION_L);
__cpufreq_driver_target(policy, freq_next, CPUFREQ_RELATION_L);
}对于ondemand来说，因为传入的负载是乘上了当前频率后的归一化值，所以计算新频率时，直接用load_freq除以想要的负载即可。本来计算出来的频率直接通过__cpufreq_driver_target函数，交给cpufreq_driver调节频率即可，但是这里的处理考虑了powersave_bias的设置情况，当设置了powersave_bias时，表明我们为了进一步节省电力，我们希望在计算出来的新频率的基础上，再乘以一个powersave_bias设定的百分比，作为真正的运行频率，powersave_bias的值从0-1000，每一步代表0.1%。实际的情况比想象中稍微复杂一点，考虑到乘以一个powersave_bias后的新频率可能不在cpu所支持的频率表中，ondemand算法会在频率表中查找，分别找出最接近新频率的一个区间，由高低两个频率组成，低的频率记入od_cpu_dbs_info_s结构的freq_lo字段中，高的频率通过od_ops.powersave_bias_target回调返回。同时，od_ops.powersave_bias_target回调函数还计算出高低两个频率应该运行的时间，分别记入od_cpu_dbs_info_s结构的freq_hi_jiffies和freq_low_jiffies字段中。原则是，通过两个不同频率的运行时间的组合，使得综合结果接近我们想要的目标频率。详细的计算逻辑请参考函数：generic_powersave_bias_target。
讨论完上面两个函数，让我们回到本节的开头，负载的计算工作是在一个工作队列中发起的，前面说过，ondemand对应的工作队列的工作函数是od_dbs_timer，我们看看他的实现代码：
static void od_dbs_timer(struct work_struct *work)
/* Common NORMAL_SAMPLE setup */
core_dbs_info-&sample_type = OD_NORMAL_SAMPLE;
if (sample_type == OD_SUB_SAMPLE) {
delay = core_dbs_info-&freq_lo_
__cpufreq_driver_target(core_dbs_info-&cdbs.cur_policy,
core_dbs_info-&freq_lo, CPUFREQ_RELATION_H);
dbs_check_cpu(dbs_data, cpu);
if (core_dbs_info-&freq_lo) {
/* Setup timer for SUB_SAMPLE */
core_dbs_info-&sample_type = OD_SUB_SAMPLE;
delay = core_dbs_info-&freq_hi_
max_delay:
if (!delay)
delay = delay_for_sampling_rate(od_tuners-&sampling_rate
* core_dbs_info-&rate_mult);
gov_queue_work(dbs_data, dbs_info-&cdbs.cur_policy, delay, modify_all);
mutex_unlock(&core_dbs_info-&cdbs.timer_mutex);
}如果sample_type是OD_SUB_SAMPLE时，表明上一次采样时，需要用高低两个频率来模拟实际的目标频率中的第二步：需要运行freq_lo，并且持续时间为freq_lo_jiffies。否则，调用公共层计算负载的API：dbs_check_cpu，开始一次新的采样，当powersave_bias没有设置时，该函数返回前，所需要的新的目标频率会被设置，考虑到powersave_bias的设置情况，判断一下如果freq_lo被设置，说明需要用高低两个频率来模拟实际的目标频率，高频率已经在dbs_check_cpu返回前被设置（实际的设置工作是在od_check_cpu中），所以把sample_type设置为OD_SUB_SAMPLE，以便下一次运行工作函数进行采样时可以设置低频率运行。最后，调度工作队列在下一个采样时刻再次运行，这样，cpu的工作频率实现了在每个采样周期，根据实际的负载情况，动态地设定合适的工作频率进行运行，既满足了性能的需求，也降低了系统的功耗，达到了cpufreq系统的最终目的，整个流程可以参考下图：
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & 图 5.1 &负载计算和频率选择
版权声明：本文为博主原创文章，未经博主允许不得转载。
* 以上用户言论只代表其个人观点，不代表CSDN网站的观点或立场
访问：843399次
积分：7131
积分：7131
排名：第1413名
原创：51篇
评论：515条
(1)(4)(4)(3)(3)(4)(4)(4)(1)(5)(2)(2)(1)(1)(2)(1)(1)(2)(3)(5)(1)(1)Linux动态频率调节系统CPUFreq之一：概述
编辑：www.fx114.net
本篇文章主要介绍了"Linux动态频率调节系统CPUFreq之一：概述"，主要涉及到Linux动态频率调节系统CPUFreq之一：概述方面的内容，对于Linux动态频率调节系统CPUFreq之一：概述感兴趣的同学可以参考一下。
随着技术的发展，我们对CPU的处理能力提出了越来越高的需求，芯片厂家也对制造工艺不断地提升。现在的主流PC处理器的主频已经在3GHz左右，就算是智能手机的处理器也已经可以工作在1.5GHz以上，可是我们并不是时时刻刻都需要让CPU工作在最高的主频上，尤其是移动设备和笔记本电脑，大部分时间里，CPU其实工作在轻负载状态下，我们知道：主频越高，功耗也越高。为了节省CPU的功耗和减少发热，我们有必要根据当前CPU的负载状态，动态地提供刚好足够的主频给CPU。在Linux中，内核的开发者定义了一套框架模型来完成这一目的，它就是CPUFreq系统。1. &sysfs接口我们先从CPUFreq提供的sysfs接口入手，直观地看看它提供了那些功能。以下是我的电脑输出的结果：droidphone@990:~$ cd /sys/devices/system/cpu
droidphone@990:/sys/devices/system/cpu$ ls
kernel_max
probe所有与CPUFreq相关的sysfs接口都位于：/sys/devices/system/cpu下面，我们可以看到，8个cpu分别建立了一个自己的目录，从cpu0到cpu7，我们再看看offline和online以及present的内容：droidphone@990:/sys/devices/system/cpu$ cat online
droidphone@990:/sys/devices/system/cpu$ cat offline
droidphone@990:/sys/devices/system/cpu$ cat present
droidphone@990:/sys/devices/system/cpu$online代表目前正在工作的cpu，输出显示编号为0-7这8个cpu在工作，offline代表目前被关掉的cpu，present则表示主板上已经安装的cpu，由输出可以看到，我的主板可以安装16个cpu（因为intel的超线程技术，其实物理上只是8个），第8-15号cpu处于关闭状态（实际上不存在，因为present只有0-7）。接着往下看：droidphone@990:/sys/devices/system/cpu/cpu0$ ls
thermal_throttle
crash_notes
droidphone@990:/sys/devices/system/cpu/cpu0$ cd cpufreq/
droidphone@990:/sys/devices/system/cpu/cpu0/cpufreq$ ls
affected_cpus
related_cpus
scaling_max_freq
bios_limit
scaling_available_frequencies
scaling_min_freq
cpuinfo_cur_freq
scaling_available_governors
scaling_setspeed
cpuinfo_max_freq
scaling_cur_freq
cpuinfo_min_freq
scaling_driver
cpuinfo_transition_latency
scaling_governor
droidphone@990:/sys/devices/system/cpu/cpu0/cpufreq$ 在我的电脑上，部分的值如下：cpuinfo_cur_freq: & 1600000cpuinfo_max_freq: &3401000cpuinfo_min_freq: & 1600000scaling_cur_freq: & &1600000scaling_max_freq: &3401000scaling_min_freq: & 1600000所以，我的cpu0的最低运行频率是1.6GHz，最高是3.4GHz，目前正在运行的频率是1.6GHz，前缀cpuinfo代表的是cpu硬件上支持的频率，而scaling前缀代表的是可以通过CPUFreq系统用软件进行调节时所支持的频率。cpuinfo_cur_freq代表通过硬件实际上读到的频率值，而scaling_cur_freq则是软件当前的设置值，多数情况下这两个值是一致的，但是也有可能因为硬件的原因，有微小的差异。scaling_available_frequencies会输出当前软件支持的频率值，看看我的cpu支持那些频率：droidphone@990:/sys/devices/system/cpu/cpu0/cpufreq$ cat scaling_available_frequencies
droidphone@990:/sys/devices/system/cpu/cpu0/cpufreq$
Oh，从1.6GHz到3.4GHz，一共支持10挡的频率可供选择。scaling_available_governors则会输出当前可供选择的频率调节策略：conservative ondemand userspace powersave performanceOK，我的系统当前选择ondemand这种策略，这种策略的主要思想是：只要cpu的负载超过某一个阀值，cpu的频率会立刻提升至最高，然后再根据实际情况降到合适的水平。详细的情况我们留在后面的章节中讨论。scaling_driver则会输出当前使用哪一个驱动来设置cpu的工作频率。当我们选择userspace作为我们的调频governor时，我们可以通过scaling_setspeed手工设置需要的频率。powersave则简单地使用最低的工作频率进行运行，而performance则一直选择最高的频率进行运行。2. &软件架构通过上一节的介绍，我们可以大致梳理出CPUFreq系统的构成和工作方式。首先，CPU的硬件特性决定了这个CPU的最高和最低工作频率，所有的频率调整数值都必须在这个范围内，它们用cpuinfo_xxx_freq来表示。然后，我们可以在这个范围内再次定义出一个软件的调节范围，它们用scaling_xxx_freq来表示，同时，根据具体的硬件平台的不同，我们还需要提供一个频率表，这个频率表规定了cpu可以工作的频率值，当然这些频率值必须要在cpuinfo_xxx_freq的范围内。有了这些频率信息，CPUFreq系统就可以根据当前cpu的负载轻重状况，合理地从频率表中选择一个合适的频率供cpu使用，已达到节能的目的。至于如何选择频率表中的频率，这个要由不同的governor来实现，目前的内核版本提供了5种governor供我们选择。选择好适当的频率以后，具体的频率调节工作就交由scaling_driver来完成。CPUFreq系统把一些公共的逻辑和接口代码抽象出来，这些代码与平台无关，也与具体的调频策略无关，内核的文档把它称为CPUFreq Core（/Documents/cpufreq/core.txt）。另外一部分，与实际的调频策略相关的部分被称作cpufreq_policy，cpufreq_policy又是由频率信息和具体的governor组成，governor才是具体策略的实现者，当然governor需要我们提供必要的频率信息，governor的实现最好能做到平台无关，与平台相关的代码用cpufreq_driver表述，它完成实际的频率调节工作。最后，如果其他内核模块需要在频率调节的过程中得到通知消息，则可以通过cpufreq notifiers来完成。由此，我们可以总结出CPUFreq系统的软件结构如下：3. &cpufreq_policy一种调频策略的各种限制条件的组合称之为policy，代码中用cpufreq_policy这一数据结构来表示：struct cpufreq_policy {
cpumask_var_
cpumask_var_t
unsigned int
unsigned int
struct cpufreq_
/* in kHz */
/* in kHz */
unsigned i
struct cpufreq_governor *
*governor_
struct work_
struct cpufreq_real_policy
struct completion
};其中的各个字段的解释如下：cpus和related_cpus&& &这两个都是cpumask_var_t变量，cpus表示的是这一policy控制之下的所有还出于online状态的cpu，而related_cpus则是online和offline两者的合集。主要是用于多个cpu使用同一种policy的情况，实际上，我们平常见到的大多数系统中都是这种情况：所有的cpu同时使用同一种policy。我们需要related_cpus变量指出这个policy所管理的所有cpu编号。cpu和last_cpu&& &虽然一种policy可以同时用于多个cpu，但是通常一种policy只会由其中的一个cpu进行管理，cpu变量用于记录用于管理该policy的cpu编号，而last_cpu则是上一次管理该policy的cpu编号（因为管理policy的cpu可能会被plug out，这时候就要把管理工作迁移到另一个cpu上）。cpuinfo&& &保存cpu硬件所能支持的最大和最小的频率以及切换延迟信息。min/max/cur&&该policy下的可使用的最小频率，最大频率和当前频率。policy & &该变量可以取以下两个值：CPUFREQ_POLICY_POWERSAVE和CPUFREQ_POLICY_PERFORMANCE，该变量只有当调频驱动支持setpolicy回调函数的时候有效，这时候由驱动根据policy变量的值来决定系统的工作频率或状态。如果调频驱动（cpufreq_driver）支持target回调，则频率由相应的governor来决定。governor和governor_data&& &指向该policy当前使用的cpufreq_governor结构和它的上下文数据。governor是实现该policy的关键所在，调频策略的逻辑由governor实现。update&& &有时在中断上下文中需要更新policy，需要利用该工作队列把实际的工作移到稍后的进程上下文中执行。user_policy&& &有时候因为特殊的原因需要修改policy的参数，比如溫度过高时，最大可允许的运行频率可能会被降低，为了在适当的时候恢复原有的运行参数，需要使用user_policy保存原始的参数（min，max，policy，governor）。kobj&& &该policy在sysfs中对应的kobj的对象。4. &cpufreq_governor所谓的governor，我把它翻译成：调节器。governor负责检测cpu的使用状况，从而在可用的范围中选择一个合适的频率，代码中它用cpufreq_governor结构来表示：struct cpufreq_governor {
name[CPUFREQ_NAME_LEN];
(*governor)
(struct cpufreq_policy *policy,
unsigned int event);
ssize_t (*show_setspeed)
(struct cpufreq_policy *policy,
char *buf);
(*store_setspeed)
(struct cpufreq_policy *policy,
unsigned int freq);
unsigned int max_transition_ /* HW must be able to switch to
next freq faster than this value in nano secs or we
will fallback to performance governor */
struct list_head
struct module
};其中的各个字段的解释如下：name & &该governor的名字。initialized & &初始化标志。governor & &指向一个回调函数，CPUFreq Core会在不同的阶段调用该回调函数，用于该governor的启动、停止、初始化、退出动作。list_head & &所有注册的governor都会利用该字段链接在一个全局链表中，以供系统查询和使用。5. &cpufreq_driver上一节提到的gonvernor只是负责计算并提出合适的频率，但是频率的设定工作是平台相关的，这需要cpufreq_driver驱动来完成，cpufreq_driver的结构如下：struct cpufreq_driver {
struct module
name[CPUFREQ_NAME_LEN];
have_governor_per_
/* needed by all drivers */
(struct cpufreq_policy *policy);
(struct cpufreq_policy *policy);
/* define one out of two */
(*setpolicy)
(struct cpufreq_policy *policy);
(struct cpufreq_policy *policy,
unsigned int target_freq,
unsigned int relation);
/* should be defined, if possible */
unsigned int
(unsigned int cpu);
/* optional */
unsigned int (*getavg)
(struct cpufreq_policy *policy,
unsigned int cpu);
(*bios_limit)
(int cpu, unsigned int *limit);
(struct cpufreq_policy *policy);
(*suspend)
(struct cpufreq_policy *policy);
(struct cpufreq_policy *policy);
struct freq_attr
相关的字段的意义解释如下：name&& &该频率驱动的名字。init&& &回调函数，该回调函数必须实现，CPUFreq Core会通过该回调函数对该驱动进行必要的初始化工作。verify&& &回调函数，该回调函数必须实现，CPUFreq Core会通过该回调函数检查policy的参数是否被驱动支持。setpolicy/target&& &回调函数，驱动必须实现这两个函数中的其中一个，如果不支持通过governor选择合适的运行频率，则实现setpolicy回调函数，这样系统只能支持CPUFREQ_POLICY_POWERSAVE和CPUFREQ_POLICY_PERFORMANCE这两种工作策略。反之，实现target回调函数，通过target回调设定governor所需要的频率。get&& &回调函数，用于获取cpu当前的工作频率。getavg&& &回调函数，用于获取cpu当前的平均工作频率。6. &cpufreq notifiersCPUFreq的通知系统使用了内核的标准通知接口。它对外提供了两个通知事件：policy通知和transition通知。policy通知用于通知其它模块cpu的policy需要改变，每次policy改变时，该通知链上的回调将会用不同的事件参数被调用3次，分别是：CPUFREQ_ADJUST & &只要有需要，所有的被通知者可以在此时修改policy的限制信息，比如温控系统可能会修改在大允许运行的频率。CPUFREQ_INCOMPATIBLE & &只是为了避免硬件错误的情况下，可以在该通知中修改policy的限制信息。CPUFREQ_NOTIFY & &真正切换policy前，该通知会发往所有的被通知者。transition通知链用于在驱动实施调整cpu的频率时，用于通知相关的注册者。每次调整频率时，该通知会发出两次通知事件：CPUFREQ_PRECHANGE & &调整前的通知。CPUFREQ_POSTCHANGE & &完成调整后的通知。当检测到因系统进入suspend而造成频率被改变时，以下通知消息会被发出：CPUFREQ_RESUMECHANGEfrom：
本文标题：
本页链接：

linux sysfs 创建文件里头哪个是设置cpu是否online的

我要回帖

更多关于 sysfs 的文章

随机推荐