[go: up one dir, main page]

CN102232282B - 一种实现数据中心资源负载均衡的方法及装置 - Google Patents

一种实现数据中心资源负载均衡的方法及装置 Download PDF

Info

Publication number
CN102232282B
CN102232282B CN201080005220.3A CN201080005220A CN102232282B CN 102232282 B CN102232282 B CN 102232282B CN 201080005220 A CN201080005220 A CN 201080005220A CN 102232282 B CN102232282 B CN 102232282B
Authority
CN
China
Prior art keywords
physical machine
load
current
attribute
utilance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080005220.3A
Other languages
English (en)
Other versions
CN102232282A (zh
Inventor
田文洪
卢国明
景晨
钟元椋
胡金安
董旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN102232282A publication Critical patent/CN102232282A/zh
Application granted granted Critical
Publication of CN102232282B publication Critical patent/CN102232282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5019Workload prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种实现数据中心资源负载均衡的方法及装置,技术方案中所述方法包括:获取调度域内各物理机属性的当前利用率,并根据所述当前利用率确定剩余能力满足当前分配任务的物理机,所述属性包括CPU负载、内存负载及网络负载;根据所述当前利用率确定所述调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;选择所述负载方差值最小的物理机部署所述当前分配任务。本发明所述装置包括选择控制模块、计算处理模块及部署执行模块。采用本发明的技术方案,能够解决用户需求规定和物理服务器规定不一致造成的物理服务器负载不均衡问题。

Description

一种实现数据中心资源负载均衡的方法及装置
技术领域
本发明涉及计算机数据处理领域,更具体的说,涉及一种实现数据中心资源负载均衡的方法及装置。
发明背景
云计算数据中心作为一些大型服务器集群,存在大量规格配置存在差异的的物理服务器,通过虚拟化技术,每个物理服务器可以虚拟出多个虚拟机为用户来部署和调度资源。通常云计算数据中心调度系统的主要流程如图1所示:用户通过Internet发起请求;超级调度中心依据用户的身份特征和请求的业务特征,将该请求提交给合适的数据中心,再由数据中心的管理程序提交给某个调度域,在调度域内执行某种调度算法,对该资源请求分配;调度中心在后台同时执行优化操作,将不同数据中心的资源按照优化目标函数和空闲及配置等信息排序,以备后来者使用;对该资源请求分配后,执行调度任务,部署资源,用户开始使用资源。
云计算数据中心将虚拟机按用户需求规格动态地自动化地分配给用户。但是由于用户的需求规格和数据中心所有物理服务器的规格配置很可能不一致,如果采用常用的轮转法,加权轮转法,最小负载(或链接数)优先,加权最小负载优先法,哈希法等简单的分配调度方法,很难达到物理服务器负载均衡。
轮转法通过预先设定一个轮转周期,依次将用户需求的虚拟机分配给不同的物理服务器,一个轮转周期结束后重新开始新一个轮转,可以看出此方法在分配虚拟机时并没有考虑负载均衡的问题。
加权轮转法通过预先对物理服务器设定权值,在负载均衡分配虚拟机的过程中,轮转选择物理服务器,如果被选择的物理服务器的权值为0,则跳过该服务器并选择下一台,如被选择的服务器的权值不为0,则选中该服务器并将该服务器的权值减1,后继的选择在前次选择的基础上轮转,因此权值高的物理服务器获得的服务次数就与其权值成正比。
最小负载(或链接数)优先法在每次分配虚拟机时,要先检查当前一段时间内所有物理服务器的负载情况,然后选择当前一段时间内负载最小的物理服务器分配虚拟机,但该方法是合理的平均分配访问量来实现均衡,不是虚拟机的调度与分配,不能实现数据中心内各物理资源的负载均衡。
加权最小负载优先法,与加权轮转法类似,对规格配置不一致的物理服务器设定不同的权值,按照服务器设定的权值来选择分配虚拟机。
哈希法,主要是通过预先设计一个哈希函数,用于映射用户需求的虚拟机到相应的物理服务器上,执行速度较快,但如何设计既满足用户规格需求又满足不同物理服务器规格配置,并能解决负载不均衡的问题的一个哈希函数几乎是不可能的。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:上述简单的分配调度方法,均不能解决用户规格需求和物理服务器规格配置不一致造成的各物理服务器负载不均衡问题。
发明内容
本发明的目的是提供一种实现数据中心资源负载均衡的方法及装置,能够解决用户需求规格与物理服务器配置不一致造成的物理服务器负载不均衡的问题。
本发明实施例提供了一种实现数据中心资源负载均衡的方法,包括:
一种实现数据中心资源负载均衡的方法,其特征在于,包括:
获取调度域内各物理机属性的当前利用率,并根据所述当前利用率确定剩余能力满足当前分配任务的物理机,所述属性包括CPU负载、内存负载及网络负载;
根据所述当前利用率确定所述调度域属性的负载均值;
针对所述剩余能力满足当前分配任务的物理机,对所述剩余能力满足当前分配任务的物理机部署虚拟机后的属性的利用率进行预测,获得所述剩余能力满足当前分配任务的物理机的负载预测值;
根据所述负载均值及所述负载预测值计算获得所述物理机的负载方差值;选择所述负载方差值最小的物理机部署所述当前分配任务;
其中,所述负载方差值的计算公式包括:
D=(a%-x)2+(b%-y)2+(c%-z)2
其中,a%、b%、c%为对所述物理机预测部署虚拟机后获得的CPU、内存及网络的负载预测值,x、y、z为所述调度域内当前CPU负载均值,内存负载均值及网络负载均值。
本发明实施例提供了一种实现数据中心资源负载均衡的装置,包括:
选择控制模块,用于获取调度域内各物理机属性的当前利用率,并根据所述当前利用率确定剩余能力满足当前分配任务的物理机,所述属性包括CPU负载、内存负载及网络负载;
计算处理模块,用于根据所述当前利用率确定所述调度域属性的负载均值,并
针对所述剩余能力满足当前分配任务的物理机,对所述剩余能力满足当前分配任务的物理机部署虚拟机后的属性的利用率进行预测,获得所述剩余能力满足当前分配任务的物理机的负载预测值,以及根据所述负载均值及所述负载预测值计算获得所述物理机的负载方差值,其中,所述负载方差值的计算公式包括:
D=(a%-x)2+(b%-y)2+(c%-z)2
其中,a%、b%、c%为对所述物理机预测部署虚拟机后获得的CPU、内存及网络的负载预测值,x、y、z为所述调度域内当前CPU负载均值,内存负载均值及网络负载均值;
部署执行模块,用于选择所述负载方差值最小的物理机部署所述当前分配任务。
由上述本发明的实施例提供的技术方案可以看出,通过对调度域中各物理机的属性以及当前利用率进行监控,能够及时确定物理机当前的负载状态,同时采用均方差最小值法来选择合适的物理机,解决了需求规格不同造成的负载不均衡的问题。
附图简要说明
图1为现有调度系统参考体系结构示意图;
图2为本发明实施例一种实现数据中心资源负载均衡的方法流程图;
图3为本发明实施例一种实现数据中心资源负载均衡的方法具体流程图;
图4为本发明实施例一种实现数据中心资源负载均衡的装置结构示意图;
图5为本发明实施例一种实现数据中心资源负载均衡的装置具体结构示意图。
实施本发明的方式
本发明实施例一种实现数据中心资源负载均衡的方法及装置,能够根据获取的调度域内各物理机属性的当前利用率来确定剩余能力满足当前分配任务的物理机;根据当前利用率确定所述调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;选择所述负载方差值最小的物理机部署所述当前分配任务。由于剩余能力是根据获取到的各物理机属性的当前利用率确定的,因此该剩余能力代表了调度中各物理机的实际状态;在计算负载方差值的过程中,根据用户任务需求对部署虚拟机后的物理机的负载程度进行了预测,因此能够准确的考虑到部署虚拟机后各物理机的负载状态,从而选择合适的虚拟机进行任务部署。解决了云计算数据中心现有简单调度分配方法不能解决用户需求规格和数据中心物理服务器配置规格不一样产生的负载不均衡问题。
下面为了进一步理解本发明实施例的技术方案,下面结合附图进行说明。
首先,对本发明实施例的实现过程中涉及的参数进行定义,具体如下:
(1)一个CPU的利用率定义为:该CPU在时间t内的平均利用率;
一台物理机的CPU的利用率lc定义为:这台物理机上所有CPU的利用率的平均值;
一个调度域内的CPU负载均值Vc定义为:一个调度域内的所有物理机的CPU利用率,依据物理机各自的CPU个数(nui)进行加权平均,得到CPU负载均值Vc,负载告警值δc=b+Vc,其中b为自定义常量,Vc=(∑lci*nui)/∑nui
(2)一台物理机的内存的利用率lm定义为:该物理机内存在时间t内的平均利用率;
内存负载均值Vm的定义:一个调度域内的所有物理机的内存的利用率,依据物理机各自的内存大小mi进行加权平均的平均值Vm;
负载告警值δm=b+Vm,其中b为自定义常量,Vm=(∑lmi*mi)/∑mi
(3)一台物理机的网络的利用率ln定义为:此物理机网络在时间t内的平均利用率;
网络负载均值Vn的定义:一个调度域内的所有物理机的网络的利用率,依据物理机各自的网络带宽大小ni进行加权平均的平均值Vn;
负载告警值δn=b+Vn,其中b为自定义常量,Vn=(∑lni*ni)/∑ni
(4)一台物理机的综合负载M的定义:综合负载是一个六维向量,Mi=(ci,mi,bi,lci,lmi,lni);其中ci代表物理服务器i的CPU计算能力(可用CPU clock speed Ghz或等价值衡量),mi表示物理服务器i的内存总大小(可用Giga byte为单位衡量),bi表示物理服务器i的对外总带宽(可用Mbps为单位衡量),(lci,lmi,lni)分别为前一段时间t内物理服务器i的CPU,内存和网络带宽的利用率平均值;
(5)物理服务器的剩余能力(CPU,内存,网络)=该物理服务器的总(CPU,内存,网络)能力-该物理服务器已被暂用的(CPU,内存,网络)能力;其中,剩余能力可以从(4)定义的综合负载六维向量计算出。
如图2所示,本发明实施例一种实现数据中心资源负载均衡的方法,技术方案包括:
步骤201、获取调度域内各物理机属性的当前利用率,并根据所述当前利用率确定剩余能力满足当前分配任务的物理机,所述属性包括CPU负载、内存负载及网络负载;
步骤202、根据所述当前利用率确定所述调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;
步骤203、选择所述负载方差值最小的物理机部署所述当前分配任务。
可见,通过获取调度域内各物理机属性的当前利用率,能够充分获知当前物理机的实际剩余能力,同时,由于在选择部署的物理机的过程中,采用了均方差最小值法,解决了需求规格不同造成的负载不均衡问题。
在本发明的一个实施例中,步骤201中根据所述当前利用率确定剩余能力满足当前分配任务的物理机,包括:
(1)将所述调度域内各物理机属性的总负载能力与所述各物理机属性的当前利用率的差值,做为所述各物理机属性的剩余能力;
(2)将所述剩余能力与所述当前分配任务的规格做比较,确定所述剩余能力大于或等于当前分配任务规格的物理机。
需要说明的是,本发明实施例中物理机属性的总负载能力是指该物理机具有的CPU、内存及网络的总大小;各物理机CPU的当前利用率是其所具有的CUP实际利用率的平均值。各物理机的剩余能力可以采用上述定义(5)剩余能力的公式计算出来。
例如:一个物理机PM1的总负载能力为,(4CU,3G,100M),该物理机内存的当前利用率是50%,网络当前利用率是10%,该物理机包含了4个CPU,第一个CPU实际利用率是30%,第二个CPU实际利用率是30%,第三个CPU实际利用率是40%,第4个CPU实际利用率是20%,那么该物理机CPU的当前利用率为(30%+30%+40%+20%)/4=30%;
用定义(4)提出的物理机综合负载形式表示该物理机的综合负载PM1的具体形式为:
PM1=(4CU,3G,100M,30%,50%,10%)
PM1属性的剩余能力=(4*(1-30%),3*(1-50%),100*(1-10%))=(2.8,1.5,90).
用PM1的剩余能力与当前分配任务的规格做比较,来判断是否满足当前分配任务,例如:当前分配任务为(2,1,10),该PM1的剩余能力满足当前分配任务。
在本发明的一个实施例中,步骤202根据所述当前利用率确定所述调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值,具体包括:
(1)针对满足所述当前分配任务的物理机,对所述物理机部署虚拟机后的属性的利用率进行预测,获得所述负载预测值;
(2)根据所述负载均值及所述负载预测值计算获得所述负载方差值;所述负载方差值的计算公式包括:
D=(a%-x)2+(b%-y)2+(c%-z)2
其中,a%、b%、c%为对所述物理机预测部署虚拟机后获得的CPU、内存及网络的负载预测值,x、y、z为所述调度域内当前CPU负载均值,内存负载均值及网络负载均值。
具体的说,调度域内属性的负载均值Vc、Vm、Vn可以根据定义(1)(2)(3)中描述的方法,来根据获得的属性当前利用率lc、lm、ln计算获得。
在对物理机部署虚拟机后的属性利用率进行预测时,本发明实施例中要遵循预定的规则,所述预定规则包括:
在预测部署虚拟机时,对于所在物理服务器来说,该物理服务器的综合负载要增加,因此总是按照虚拟机属性(CPU、内存、网络)所需的最大份额计算其属性预测值,以留足资源;同时若在观察一段时间t后发现该虚拟机并未使用到所要求的最大份额,则再分配虚拟机时进行动态调整。
也就是说,对于一个物理机来说,其CPU预测值=CPU当前利用率+(虚拟机所占CPU/该物理机总CPU)*100%;内存预测值=内存当前利用率+(虚拟机所占内存/该物理机总内存)*100%;网络预测值=网络当前利用率+(虚拟机所占网络负载/该物理机总网络负载)*100%。
在本发明的一个实施例中,所述方法还可以包括:
判断所述当前分配任务是否为单虚拟机任务;
当所述当前分配任务为单虚拟机任务时,将所述调度域内的各物理机排列成n×(m+2)矩阵,m=MAX(单物理机CPU的个数),矩阵的每一行为每个物理机各CPU在一段时间内的利用率、内存利用率及网络利用率,每一列为所述调度域中各物理机;
当所述当前分配任务非单虚拟机任务时,将所述调度域内各物理机集群排列成n×3矩阵,矩阵的每一行为一个物理机集群的CPU一段时间内的利用率,内存利用率及网络利用率,每一列为所述调度域中各物理机集群。
需要说明的是,由于本发明实施例中是要根据二维网格算法来确定最佳的物理机部署虚拟机任务,因此要将每个物理机的属性信息,排列成矩阵的形式。使用二维网格算法时,二维网格每一行并行计算出每个物理机的各属性的加权后的方差,形成一列值,然后每一列再排序找出方差值最小的物理机进行部署。
由于物理机集群属于特殊业务,因此集群的CPU当前利用率用一个能力值来表示,此能力值为集群内所有物理机的CPU实际能力的平均值。
在本发明的一个实施例中,步骤203选择所述负载方差值最小的物理机部署所述当前分配任务,包括:
当所述当前分配任务为单虚拟机任务时,选择满足所述当前分配任务的物理机中负载方差值最小的物理机进行部署;
当所述当前分配任务为非单虚拟机任务时,选择满足所述当前分配任务的物理机集群中负载方差值最小的物理机进行部署;
当所述负载方差值最小的物理机或物理机集群的数量为大于一个时,任选一个物理机或物理机集群部署当前分配任务。
在本发明的一个实施例中,所述方法还可以包括:
(1)对所述调度域内各物理机属性的利用率进行监控;
(2)在所述属性的利用率超出预定值的物理机触发告警迁移时,根据所述属性的告警值与调度域内该属性负载均值的差值,确定移除所述物理机上的虚拟机;
(3)为移除的所述虚拟机寻找物理机进行部署。
具体的说,本发明实施例中当调度域中某台物理机的属性,如:CPU、内存、网络一种或多种超过各自的告警值δ时,将触发告警迁移流程。例如:某个物理机的CPU告警时,可以用当前告警的CPU负载值减去该调度域的CPU负载均值,得到一个差值,用该差值比较此物理机上所有虚拟机的CPU利用率,来决定移除哪些虚拟机,具体可以是当当前虚拟机的CPU利用率中至少有一个大于等于该差值时,要移除一个或多个虚拟机,然后重新计算该差值,并确定该物理机的CPU是否仍存在告警,如果告警仍存在,则继续对虚拟机进行移除。
在本发明的一个实施例中,为移除的所述虚拟机寻找物理机进行部署,进一步包括:
根据各物理机的当前利用率确定剩余能力满足被移除的虚拟机分配任务的物理机;
根据各物理机的当前利用率确定调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;
选择所述负载方差值最小的物理机部署所述当前分配任务。
需要说明的是,本发明实施例中为移除的虚拟机进行部署的过程,与为上述步骤201、202、203所述的分配任务部署的过程相同,也就是说,在告警处理之后,需要为移除的虚拟机任务重新确定一个或多个物理机进行部署。因此,为移除的虚拟机确定物理机的部署过程可以参见上述关于步骤201、202、203中的相关内容,在此不作一一赘述。
在本发明的一个实施例中,所述方法还可以包括:
(1)确定需要进行优化操作的物理机的ID;
(2)用所述物理机各属性的当前利用率与优化目的值的差值,与所述物理机上各虚拟机的属性利用率做比较,以便确定要移除的虚拟机;
(3)为移除的所述虚拟机选择物理机进行部署。
需要说明的是,在优化过程中优化目的值是根据管理员的经验预先设定的,同时,在用当前利用率与优化目的值的差值,比较虚拟机各属性利用率来移除虚拟机的过程和目的,与上述告警处理过程中移除虚拟机的技术方案相似,例如:同样在当前虚拟机的CPU利用率中至少有一个大于等于该差值时,要移除一个或多个虚拟机,然后重新计算该差值,直到确定虚拟机CPU全部小于该差值时,结束对虚拟机的移除过程。
在本发明的一个实施例中,为移除的所述虚拟机选择物理机进行部署,进一步包括:
根据各物理机的当前利用率确定剩余能力满足被移除的虚拟机分配任务的物理机;
根据各物理机的当前利用率确定调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;
选择所述负载方差值最小的物理机部署所述当前分配任务。
需要说明的是,本发明实施例中为移除的虚拟机进行部署的过程,与为上述步骤201、202、203所述的分配任务部署的过程相同,也就是说,在优化操作之后,需要为移除的虚拟机任务重新确定一个或多个物理机进行部署。因此,为移除的虚拟机确定物理机的部署过程可以参见上述关于步骤201、202、203中的相关内容,在此不作一一赘述。
需要说明的是,上述实施例分别说明了一种实现数据中心资源负载均衡的方法的三个处理过程:
(1)当前任务的分配过程;(2)告警迁移处理过程;(3)优化操作过程;
本发明实施例为上述三个处理过程分别设定了处理优先级,(2)大于(3)大于(1),可以按照该优先级的顺序执行上述三个过程,但本发明实施例并不限定与该优先级顺序。
图3所示,表示出按照上述优先级执行本发明实施例技术方案的具体流程图:
首先,判断告警迁移队列中是否有待处理的告警任务,如果有,则实施上述实施例中描述的告警迁移流程;如果没有,则判断优化队列中是否有待处理的优化任务;
如果优化队列中有待处理的优化任务时,则实施上述实施例中描述的优化处理流程;如果没有,则继续判断新任务队列中是否有待处理的分配任务;
当新任务队列中有待处理的分配任务时,实施上述实施例中描述的任务分配流程,没有,则输出当前任务为空的指示。
上述本发明实施例一种实现数据中心资源负载均衡的方法,实际应用中的具体算法如下:
Figure GDA0000390293980000161
Figure GDA0000390293980000171
Figure GDA0000390293980000181
如图4所示,基于上述图2的方法实施例,本发明实施例提供了一种实现数据中心资源负载均衡的装置,包括:
选择控制模块41,用于获取调度域内各物理机属性的当前利用率,并根据所述当前利用率确定剩余能力满足当前分配任务的物理机,所述属性包括CPU负载、内存负载及网络负载;
计算处理模块42,用于根据所述当前利用率确定所述调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;
部署执行模块43,用于选择所述负载方差值最小的物理机部署所述当前分配任务。
如图5所示,在本发明的一个实施例中,选择控制模块41可以包括:
计算单元411,用于将所述调度域内各物理机属性的总负载能力与所述各物理机属性的当前利用率的差值,做为所述各物理机属性的剩余能力;
判定单元412,用于将所述剩余能力与所述当前分配任务的规格做比较,确定所述剩余能力大于或等于当前分配任务规格的物理机。
在本发明的一个实施例中,计算处理模块42可以包括:
预测单元421,用于针对满足所述当前分配任务的物理机,对所述物理机部署虚拟机后的属性的利用率进行预测,获得所述负载预测值;
确定单元422,用于根据所述负载均值及所述负载预测值计算获得所述负载方差值;所述负载方差值的计算公式包括:
D=(a%-x)2+(b%-y)2+(c%-z)2
其中,a%、b%、c%为对所述物理机预测部署虚拟机后获得的CPU、内存及网络的负载预测值,x、y、z为所述调度域内当前CPU负载均值,内存负载均值及网络负载均值。
在本发明的一个实施例中,所述装置还包括:
任务处理模块44,用于判断所述当前分配任务是否为单虚拟机任务;
当所述当前分配任务为单虚拟机任务时,将所述调度域内的各物理机排列成n×(m+2)矩阵,m=MAX(单物理机CPU的个数),矩阵的每一行为每个物理机各CPU在一段时间内的利用率、内存利用率及网络利用率,每一列为所述调度域中各物理机;
当所述当前分配任务非单虚拟机任务时,将所述调度域内各物理机集群排列成n×3矩阵,矩阵的每一行为一个物理机集群的CPU一段时间内的利用率,内存利用率及网络利用率,每一列为所述调度域中各物理机集群。
在本发明的一个实施例中,部署执行模块43可以包括:
选择单元431,用于判断当所述负载方差值最小的物理机或物理机集群的数量是否为大于一个;
执行单元432,用于当所述物理机或物理机集群的数量为一个时,选择满足所述当前分配任务的物理机或物理机集群中负载方差值最小的物理机或物理机集群进行部署;当所述物理机或物理机集群的数量为大于一个时,任选一个物理机或物理机集群部署当前分配任务。
在本发明的一个实施例中,所述装置还可以包括:
告警监控模块45,用于对所述调度域内各物理机属性的利用率进行监控;
告警迁移模块46,用于在所述属性的利用率超出预定值的物理机触发告警迁移时,根据所述属性的告警值与调度域内该属性负载均值的差值,确定移除所述物理机上的虚拟机;
迁移部署模块47,用于为移除的所述虚拟机寻找物理机进行部署。
在本发明的一个实施例中,迁移部署模块47进一步包括:
计算处理单元471,用于根据各物理机的当前利用率确定剩余能力满足被移除的虚拟机分配任务的物理机;以及,根据各物理机的当前利用率确定调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;
部署执行单元472,用于选择所述负载方差值最小的物理机部署所述当前分配任务。
在本发明的一个实施例中,所述装置还可以包括:
优化选择模块48,用于确定需要进行优化操作的物理机的ID;
优化操作模块49,用于用所述物理机各属性的当前利用率与优化目的值的差值,与所述物理机上各虚拟机的属性利用率做比较,以便确定要移除的虚拟机;
优化部署模块50,用于为移除的所述虚拟机选择物理机进行部署。
在本发明的一个实施例中,优化部署模块50进一步包括:
优化计算单元501,用于根据各物理机的当前利用率确定剩余能力满足被移除的虚拟机分配任务的物理机;以及,根据各物理机的当前利用率确定调度域属性的负载均值,并根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;
优化部署单元502,用于选择所述负载方差值最小的物理机部署所述当前分配任务。
需要说明的是,本发明所述的装置实施例是基于上述图2的方法实施例获得的,其中各功能模块与图2方法实施例中各步骤一一对应,因此本发明所述的装置实施例与图2的方法实施例包含了相同或相应的技术特征,本发明所述的装置实施例中涉及的具体技术方案已经在图2实施例中作出了同样的描述,具体可以参见图2的方法实施例,在此不作赘述。
下面将结合具体实例进一步说明本发明的技术方案,以上述三个处理过程中的新任务分配过程为例,对本发明的技术方案进行说明。
分配虚拟机任务如下:
输入任务:虚拟机部署任务规格VMx:2CU(2个CPU计算能力单元)、1G内存、10M带宽,该任务规格可以表示为(2,1,10);
步骤100、获取调度域内各物理机属性的当前利用率;
具体包括:该调度域内设定有三个物理机,PM1的总负载能力为4CU,3G,100M,其中获取到的4个CPU各自的实际利用率是30%、30%,30%,20%,因此根据所述实际利用率获得的CPU当前利用率为30%,获取到的内存当前利用率为50%,网络当前利用率为10%;
PM2的总负载能力为6CU,3G,100M,其中获取到的6个CPU各自的实际利用率是10%、10%,5%,10%、10%、15%,因此根据所述实际利用率获得的CPU当前利用率为10%,获取到的内存当前利用率为10%,网络当前利用率为30%;
PM1的总负载能力为2CU,2G,100M,其中获取到的2个CPU各自的实际利用率是70%、70%,因此根据所述实际利用率获得的CPU当前利用率为70%,获取到的内存当前利用率为60%,网络当前利用率为40%;
为了更清楚的表述出PM1的综合负载状态,采用定义(4)将三个物理机的综合负载能力表述为:
PM1=(4CU,3G,100M,30%,50%,10%)
PM2=(6CU,3G,100M,10%,10%,30%)
PM3=(2CU,2G,100M,70%,60%,40%)
200、根据所述当前利用率确定剩余能力满足当前分配任务的物理机;
具体包括:将调度域内的n个物理机列成n×(m+2)矩阵(m=MAX(单物理机CPU的个数)),矩阵的每一行为物理机的各个CPU各自在一段时间(比如时间t)内的实际利用率、内存当前利用率、网络当前利用率,每一列为此调度域内所有物理机;
在本实施例中n=3,m=6,因此,矩阵表示为:
PM1  30%  30%  40%  20%  *  *  50%  10%
PM2  10%  10%  5%  10%  10%  15%  10%  30%
PM3  70%  70%  *  *  *  *  60%  40%,其中*号处表示对应的位置为空。
通过二维网格算法确定三个物理机的剩余能力:
首先,采用定义(5)中剩余能力=总能力-已被暂用的能力,并行计算所有物理机的剩余能力:
PM1=(4*(1-30%),3*(1-50%),100*(1-10%))=(2.8,1.5,90);
PM2=(6*(1-10%),3*(1-10%),100*(1-30%))=(5.4,2.7,70);
PM3=(2*(1-70%),2*(1-60%),100*(1-40%))=(0.6,0.8,60);
与输入一任务规格(2,1,10)相对比,确定PM3剩余能力(CPU,内存)不够,只有PM1和PM2剩余能力满足;
300、根据所述当前利用率确定所述调度域属性的负载均值;
具体包括:采用上述定义(1)(2)(3)中提出的算法计算获得该调度域中CPU负载均值Vc,内存负载均值Vm以及网络负载均值Vn。
具体的Vc=(∑lci*nui)/∑nui=40%
Vm=(∑lmi*mi)/∑mi=50%
Vn=(∑lni*ni)/∑ni=20%
400、根据所述负载均值及对所述物理机属性的负载预测值计算所述物理机的负载方差值;
具体的负载方差值通过D=(a%-x)2+(b%-y)2+(c%-z)2计算获得,其中,a%、b%、c%为预测部署虚拟机后CPU、内存、网络的利用率,x、y、z为调度域内当前CPU负载均值Vc,内存负载均值Vm,网络负载均值Vn。
预测该物理机部署虚拟机后的负载预测值时,按照上述实施例提出的预测规则进行预测,总是考虑该虚拟机(CPU,内存,网络)所需的最大份额计算,以留足资源;同时若在观察一段时间t后发现该虚拟机并未使用到其所要求的最大份额,则再分配虚拟机时动态调整。
对于第一个物理机PM1的负载方差值D1的计算过程如下:
PM1=(4CU,2G,100M,30%,50%,10%);
计算放置虚拟机后的CPU利用率预测值a%=30%+(2/4)*100%=80%;
内存利用率预测值b%=50%+(1/3)*100%=83%;
网络利用率预测值c%=10%+(10/100)*100%=20%;
D1=(80%-40%)2+(83%-50%)2+(20%-20%)2=0.2689。
对于第二个物理机PM2负载方差值D2的计算过程如下:
PM2=(6CU,3G,100M,10%,10%,30%);
计算放置虚拟机后的CPU利用率预测值a%=10%+(2/6)*100%=43%;
内存利用率预测值b%=10%+(1/3)*100%=43%;
网络利用预测值率c%=30%+(10/100)*100%=40%;
D2=(43%-40%)2+(43%-50%)2+(40%-20%)2=0.0458。
500、上一步的并行计算生成2个子和D1、D2,作为一列,对这一列进行一维的排序,查找出D值最小的一个合适的物理机,此处排序结果为PM2;即选定PM2作为要部署的物理机;
600、当找到有几个物理机的D值相同时,则认为他们等价,则任选一个PMx作为部署的物理机;
700、输出分配结果:将此虚拟机分配任务部署到物理机PM2上。
由上述实施例可知,本发明实施例针对目前常用的负载均衡调度算法很难解决用户需求和物理服务器规格不一致造成的物理服务器负载不均衡问题,提出了一个依据动态负载反馈调整的负载均衡算法。通过对物理机属性当前利用率进行获取,能够准确获得各物理机的实际剩余能力;通过对该物理机部署虚拟机后的属性进行预测,能够更好的获知各物理机部署虚拟机后的负载状态,选择最佳的物理机进行部署,以便保证各物理机的负载均衡。能够更客观的找到使系统负载最均衡的物理机进行分配,解决了需求规则与服务器规格不同带来的负载不均衡的问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

Claims (16)

1.一种实现数据中心资源负载均衡的方法,其特征在于,包括:
获取调度域内各物理机属性的当前利用率,并根据所述当前利用率确定剩余能力满足当前分配任务的物理机,所述属性包括CPU负载、内存负载及网络负载;
根据所述当前利用率确定所述调度域属性的负载均值;
针对所述剩余能力满足当前分配任务的物理机,对所述剩余能力满足当前分配任务的物理机部署虚拟机后的属性的利用率进行预测,获得所述剩余能力满足当前分配任务的物理机的负载预测值;
根据所述负载均值及所述负载预测值计算获得所述物理机的负载方差值;
选择所述负载方差值最小的物理机部署所述当前分配任务;
其中,所述负载方差值的计算公式包括:
D=(a%-x)2+(b%-y)2+(c%-z)2
其中,a%、b%、c%为对所述物理机预测部署虚拟机后获得的CPU、内存及网络的负载预测值,x、y、z为所述调度域内当前CPU负载均值,内存负载均值及网络负载均值。
2.根据权利要求1所述的方法,其特征在于,根据所述当前利用率确定剩余能力满足当前分配任务的物理机,包括:
将所述调度域内各物理机属性的总负载能力与所述各物理机属性的当前利用率的差值,做为所述各物理机属性的剩余能力;
将所述剩余能力与所述当前分配任务的规格做比较,确定所述剩余能力大于或等于当前分配任务规格的物理机。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
判断所述当前分配任务是否为单虚拟机任务;
当所述当前分配任务为单虚拟机任务时,将所述调度域内的各物理机排列成n×(m+2)矩阵,m=MAX(单物理机CPU的个数),矩阵的每一行为每个物理机各CPU在一段时间内的利用率、内存利用率及网络利用率,每一列为所述调度域中各物理机;
当所述当前分配任务非单虚拟机任务时,将所述调度域内各物理机集群排列成n×3矩阵,矩阵的每一行为一个物理机集群的CPU一段时间内的利用率,内存利用率及网络利用率,每一列为所述调度域中各物理机集群。
4.根据权利要求3所述的方法,其特征在于,选择所述负载方差值最小的物理机部署所述当前分配任务,包括:
当所述当前分配任务为单虚拟机任务时,选择满足所述当前分配任务的物理机中负载方差值最小的物理机进行部署;
当所述当前分配任务为非单虚拟机任务时,选择满足所述当前分配任务的物理机集群中负载方差值最小的物理机进行部署;
当所述负载方差值最小的物理机或物理机集群的数量为大于一个时,任选一个物理机或物理机集群部署当前分配任务。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述调度域内各物理机属性的利用率进行监控;
在所述属性的利用率超出预定值的物理机触发告警迁移时,根据所述属性的告警值与调度域内该属性负载均值的差值,确定移除物理机上的虚拟机;
为移除的所述虚拟机寻找新的物理机进行部署。
6.根据权利要求5所述的方法,其特征在于,为移除的所述虚拟机寻找新的物理机进行部署,进一步包括:
根据各物理机的当前利用率确定剩余能力满足被移除的虚拟机分配任务的物理机;
根据各物理机的当前利用率确定调度域属性的负载均值,并根据所述负载均值及对所述剩余能力满足被移除的虚拟机分配任务的物理机属性的负载预测值计算所述物理机的负载方差值;
选择所述负载方差值最小的物理机部署所述当前分配任务。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定需要进行优化操作的物理机的ID;
用所述物理机各属性的当前利用率与优化目的值的差值,与所述物理机上各虚拟机的属性利用率做比较,以便确定要移除的虚拟机;
为移除的所述虚拟机选择新的物理机进行部署。
8.根据权利要求7所述的方法,其特征在于,为移除的所述虚拟机选择物理机进行部署,进一步包括:
根据各物理机的当前利用率确定剩余能力满足被移除的虚拟机分配任务的物理机;
根据各物理机的当前利用率确定调度域属性的负载均值,并根据所述负载均值及对所述剩余能力满足被移除的虚拟机分配任务的物理机属性的负载预测值计算所述物理机的负载方差值;
选择所述负载方差值最小的物理机部署所述当前分配任务。
9.一种实现数据中心资源负载均衡的装置,其特征在于,包括:
选择控制模块,用于获取调度域内各物理机属性的当前利用率,并根据所述当前利用率确定剩余能力满足当前分配任务的物理机,所述属性包括CPU负载、内存负载及网络负载;
计算处理模块,用于根据所述当前利用率确定所述调度域属性的负载均值,并针对所述剩余能力满足当前分配任务的物理机,对所述剩余能力满足当前分配任务的物理机部署虚拟机后的属性的利用率进行预测,获得所述剩余能力满足当前分配任务的物理机的负载预测值,以及根据所述负载均值及所述负载预测值计算获得所述物理机的负载方差值,其中,所述负载方差值的计算公式包括:
D=(a%-x)2+(b%-y)2+(c%-z)2
其中,a%、b%、c%为对所述物理机预测部署虚拟机后获得的CPU、内存及网络的负载预测值,x、y、z为所述调度域内当前CPU负载均值,内存负载均值及网络负载均值;
部署执行模块,用于选择所述负载方差值最小的物理机部署所述当前分配任务。
10.根据权利要求9所述的装置,其特征在于,选择控制模块包括:
计算单元,用于将所述调度域内各物理机属性的总负载能力与所述各物理机属性的当前利用率的差值,做为所述各物理机属性的剩余能力;
判定单元,用于将所述剩余能力与所述当前分配任务的规格做比较,确定所述剩余能力大于或等于当前分配任务规格的物理机。
11.根据权利要求9或10所述的装置,其特征在于,所述装置还包括:
任务处理模块,用于判断所述当前分配任务是否为单虚拟机任务;
当所述当前分配任务为单虚拟机任务时,将所述调度域内的各物理机排列成n×(m+2)矩阵,m=MAX(单物理机CPU的个数),矩阵的每一行为每个物理机各CPU在一段时间内的利用率、内存利用率及网络利用率,每一列为所述调度域中各物理机;
当所述当前分配任务非单虚拟机任务时,将所述调度域内各物理机集群排列成n×3矩阵,矩阵的每一行为一个物理机集群的CPU一段时间内的利用率,内存利用率及网络利用率,每一列为所述调度域中各物理机集群。
12.根据权利要求9所述的装置,其特征在于,部署执行模块包括:
选择单元,用于判断当所述负载方差值最小的物理机或物理机集群的数量是否为大于一个;
执行单元,用于当所述物理机或物理机集群的数量为一个时,选择满足所述当前分配任务的物理机或物理机集群中负载方差值最小的物理机或物理机集群进行部署;当所述物理机或物理机集群的数量为大于一个时,任选一个物理机或物理机集群部署当前分配任务。
13.根据权利要求9所述的装置,其特征在于,所述装置还包括:
告警监控模块,用于对所述调度域内各物理机属性的利用率进行监控;
告警迁移模块,用于在所述属性的利用率超出预定值的物理机触发告警迁移时,根据所述属性的告警值与调度域内该属性负载均值的差值,确定移除物理机上的虚拟机;
迁移部署模块,用于为移除的所述虚拟机寻找新的物理机进行部署。
14.根据权利要求13所述的装置,其特征在于,迁移部署模块包括:
计算处理单元,用于根据各物理机的当前利用率确定剩余能力满足被移除的虚拟机分配任务的物理机;以及,根据各物理机的当前利用率确定调度域属性的负载均值,并根据所述负载均值及对所述剩余能力满足被移除的虚拟机分配任务的物理机属性的负载预测值计算所述物理机的负载方差值;
部署执行单元,用于选择所述负载方差值最小的物理机部署所述当前分配任务。
15.根据权利要求9所述的装置,其特征在于,所述装置还包括:
优化选择模块,用于确定需要进行优化操作的物理机的ID;
优化操作模块,用于用所述物理机各属性的当前利用率与优化目的值的差值,与所述物理机上各虚拟机的属性利用率做比较,以便确定要移除的虚拟机;
优化部署模块,用于为移除的所述虚拟机选择新的物理机进行部署。
16.根据权利要求15所述的装置,其特征在于,优化部署模块进一步包括:
优化计算单元,用于根据各物理机的当前利用率确定剩余能力满足被移除的虚拟机分配任务的物理机;以及,根据各物理机的当前利用率确定调度域属性的负载均值,并根据所述负载均值及对所述剩余能力满足被移除的虚拟机分配任务的物理机属性的负载预测值计算所述物理机的负载方差值;
优化部署单元,用于选择所述负载方差值最小的物理机部署所述当前分配任务。
CN201080005220.3A 2010-10-29 2010-10-29 一种实现数据中心资源负载均衡的方法及装置 Active CN102232282B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2010/078247 WO2011110026A1 (zh) 2010-10-29 2010-10-29 一种实现数据中心资源负载均衡的方法及装置

Publications (2)

Publication Number Publication Date
CN102232282A CN102232282A (zh) 2011-11-02
CN102232282B true CN102232282B (zh) 2014-03-26

Family

ID=44562853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080005220.3A Active CN102232282B (zh) 2010-10-29 2010-10-29 一种实现数据中心资源负载均衡的方法及装置

Country Status (3)

Country Link
US (1) US8510747B2 (zh)
CN (1) CN102232282B (zh)
WO (1) WO2011110026A1 (zh)

Families Citing this family (172)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8028090B2 (en) 2008-11-17 2011-09-27 Amazon Technologies, Inc. Request routing utilizing client location information
US7991910B2 (en) 2008-11-17 2011-08-02 Amazon Technologies, Inc. Updating routing information based on client location
US8321568B2 (en) 2008-03-31 2012-11-27 Amazon Technologies, Inc. Content management
US8606996B2 (en) 2008-03-31 2013-12-10 Amazon Technologies, Inc. Cache optimization
US7962597B2 (en) 2008-03-31 2011-06-14 Amazon Technologies, Inc. Request routing based on class
US7970820B1 (en) 2008-03-31 2011-06-28 Amazon Technologies, Inc. Locality based content distribution
US9407681B1 (en) 2010-09-28 2016-08-02 Amazon Technologies, Inc. Latency measurement in resource requests
US8782236B1 (en) 2009-06-16 2014-07-15 Amazon Technologies, Inc. Managing resources using resource expiration data
US9122537B2 (en) * 2009-10-30 2015-09-01 Cisco Technology, Inc. Balancing server load according to availability of physical resources based on the detection of out-of-sequence packets
US9021046B2 (en) 2010-01-15 2015-04-28 Joyent, Inc Provisioning server resources in a cloud resource
US9495338B1 (en) 2010-01-28 2016-11-15 Amazon Technologies, Inc. Content distribution network
US10958501B1 (en) 2010-09-28 2021-03-23 Amazon Technologies, Inc. Request routing information based on client IP groupings
US9712484B1 (en) 2010-09-28 2017-07-18 Amazon Technologies, Inc. Managing request routing information utilizing client identifiers
US9003035B1 (en) 2010-09-28 2015-04-07 Amazon Technologies, Inc. Point of presence management in request routing
US8468247B1 (en) 2010-09-28 2013-06-18 Amazon Technologies, Inc. Point of presence management in request routing
US8452874B2 (en) 2010-11-22 2013-05-28 Amazon Technologies, Inc. Request routing processing
US8555276B2 (en) 2011-03-11 2013-10-08 Joyent, Inc. Systems and methods for transparently optimizing workloads
US10467042B1 (en) 2011-04-27 2019-11-05 Amazon Technologies, Inc. Optimized deployment based upon customer locality
US8949431B2 (en) * 2011-08-24 2015-02-03 Radware, Ltd. Method for live migration of virtual machines
US9094449B2 (en) 2011-09-14 2015-07-28 Architecture Technology Corporation Fight-through nodes for survivable computer network
US9769250B2 (en) 2013-08-08 2017-09-19 Architecture Technology Corporation Fight-through nodes with disposable virtual machines and rollback of persistent state
US9766986B2 (en) 2013-08-08 2017-09-19 Architecture Technology Corporation Fight-through nodes with disposable virtual machines and rollback of persistent state
US8640238B2 (en) * 2011-09-14 2014-01-28 Architecture Technology Corporation Fight-through nodes for survivable computer network
US9838415B2 (en) 2011-09-14 2017-12-05 Architecture Technology Corporation Fight-through nodes for survivable computer network
DE102012217202B4 (de) 2011-10-12 2020-06-18 International Business Machines Corporation Verfahren und System zum Optimieren des Platzierens virtueller Maschinen in Cloud-Computing-Umgebungen
US9218212B2 (en) * 2011-11-11 2015-12-22 International Business Machines Corporation Pairing physical devices to virtual devices to create an immersive environment
CN103116524A (zh) * 2011-11-16 2013-05-22 鸿富锦精密工业(深圳)有限公司 Cpu使用率调整系统及方法
TW201324357A (zh) * 2011-12-01 2013-06-16 Univ Tunghai 虛擬機叢集之綠能管理方法
CN103179167B (zh) * 2011-12-26 2017-02-22 深圳光启高等理工研究院 一种云计算的方法、系统及负载均衡服务器
US8782224B2 (en) 2011-12-29 2014-07-15 Joyent, Inc. Systems and methods for time-based dynamic allocation of resource management
US8547379B2 (en) 2011-12-29 2013-10-01 Joyent, Inc. Systems, methods, and media for generating multidimensional heat maps
WO2013097151A1 (zh) * 2011-12-29 2013-07-04 华为技术有限公司 一种资源调度方法及设备
CN102446115B (zh) * 2012-01-09 2014-06-18 浙江大学 一种虚拟机的动态部署方法
CN102624865B (zh) * 2012-01-09 2014-06-18 浙江大学 集群负载预测方法及分布式集群管理系统
CN103248659B (zh) * 2012-02-13 2016-04-20 北京华胜天成科技股份有限公司 一种云计算资源调度方法和系统
CN102622273B (zh) * 2012-02-23 2015-04-15 中国人民解放军国防科学技术大学 基于自学习负载预测的集群按需启动方法
TW201338537A (zh) * 2012-03-09 2013-09-16 Ind Tech Res Inst 動態派工錄影系統與方法
US9071613B2 (en) 2012-04-06 2015-06-30 International Business Machines Corporation Dynamic allocation of workload deployment units across a plurality of clouds
US9086929B2 (en) 2012-04-06 2015-07-21 International Business Machines Corporation Dynamic allocation of a workload across a plurality of clouds
CN102710503B (zh) * 2012-05-15 2017-03-15 郑州云海信息技术有限公司 一种基于“云海os”的网络负载均衡方法
US9154551B1 (en) 2012-06-11 2015-10-06 Amazon Technologies, Inc. Processing DNS queries to identify pre-processing information
JP6049887B2 (ja) * 2012-09-20 2016-12-21 アマゾン テクノロジーズ インコーポレイテッド リソース使用の自動プロファイル化
WO2014052843A1 (en) * 2012-09-28 2014-04-03 Cycle Computing, Inc. Real time optimization of compute infrastructure in a virtualized environment
CN102932170B (zh) 2012-10-22 2016-06-22 中兴通讯股份有限公司 网元负载不均检测处理方法、装置及其系统
CN103812895A (zh) * 2012-11-12 2014-05-21 华为技术有限公司 调度方法、管理节点以及云计算集群
CN102938790B (zh) * 2012-11-20 2015-10-21 无锡城市云计算中心有限公司 云计算系统中的资源分配方法
CN103856521A (zh) * 2012-12-04 2014-06-11 鸿富锦精密工业(深圳)有限公司 文件上传系统及方法
WO2014088397A1 (en) * 2012-12-06 2014-06-12 Mimos Berhad A system and method for dynamic scheduling and management of cloud resources based on roles and profiles
CN103873498B (zh) * 2012-12-11 2017-06-23 中国电信股份有限公司 云平台资源自适应预警方法与系统
CN103036979B (zh) * 2012-12-12 2015-07-01 广州尚融网络科技有限公司 一种服务器负载均衡方法及负载均衡器
CN103885831B (zh) * 2012-12-19 2017-06-16 中国电信股份有限公司 虚拟机宿主机的选择方法与装置
US9430257B2 (en) * 2013-01-03 2016-08-30 Red Hat Israel, Inc. Scheduling virtual machines using user-defined rules
WO2014110743A1 (zh) * 2013-01-16 2014-07-24 华为技术有限公司 一种数据中心间资源调度方法和设备
CN103095599A (zh) * 2013-01-18 2013-05-08 浪潮电子信息产业股份有限公司 一种云计算操作系统中动态反馈加权综合负载调度方法
US8881279B2 (en) 2013-03-14 2014-11-04 Joyent, Inc. Systems and methods for zone-based intrusion detection
US8943284B2 (en) 2013-03-14 2015-01-27 Joyent, Inc. Systems and methods for integrating compute resources in a storage area network
US8677359B1 (en) 2013-03-14 2014-03-18 Joyent, Inc. Compute-centric object stores and methods of use
US9104456B2 (en) 2013-03-14 2015-08-11 Joyent, Inc. Zone management of compute-centric object stores
US8826279B1 (en) 2013-03-14 2014-09-02 Joyent, Inc. Instruction set architecture for compute-based object stores
US8793688B1 (en) 2013-03-15 2014-07-29 Joyent, Inc. Systems and methods for double hulled virtualization operations
US9092238B2 (en) 2013-03-15 2015-07-28 Joyent, Inc. Versioning schemes for compute-centric object stores
US8775485B1 (en) 2013-03-15 2014-07-08 Joyent, Inc. Object store management operations within compute-centric object stores
CN103297499B (zh) * 2013-04-19 2017-02-08 无锡成电科大科技发展有限公司 一种基于云平台的调度方法及系统
CN103353853A (zh) * 2013-07-26 2013-10-16 浪潮电子信息产业股份有限公司 一种负载自动调节的方法
CN103412635B (zh) * 2013-08-02 2016-02-24 清华大学 数据中心节能方法及装置
CN103401939B (zh) * 2013-08-08 2017-04-26 中国航天科工集团第三研究院第八三五七研究所 一种采用混合调度策略的负载均衡方法
US11016820B2 (en) * 2013-08-26 2021-05-25 Vmware, Inc. Load balancing of resources
US10747475B2 (en) 2013-08-26 2020-08-18 Vmware, Inc. Virtual disk blueprints for a virtualized storage area network, wherein virtual disk objects are created from local physical storage of host computers that are running multiple virtual machines
US9887924B2 (en) 2013-08-26 2018-02-06 Vmware, Inc. Distributed policy-based provisioning and enforcement for quality of service
US9811531B2 (en) 2013-08-26 2017-11-07 Vmware, Inc. Scalable distributed storage architecture
US9672115B2 (en) 2013-08-26 2017-06-06 Vmware, Inc. Partition tolerance in cluster membership management
CN103473115B (zh) * 2013-09-06 2017-04-05 华为技术有限公司 虚拟机放置方法和装置
CN103514046B (zh) * 2013-09-24 2017-04-26 华为技术有限公司 一种虚拟机放置方法及集群管理服务器
CN103530189B (zh) * 2013-09-29 2018-01-19 中国科学院信息工程研究所 一种面向流式数据的自动伸缩及迁移的方法及装置
EP2854370B1 (en) * 2013-09-30 2016-04-06 Fujitsu Limited Computing device, method, and program for distributing computational load
US20150094985A1 (en) * 2013-09-30 2015-04-02 International Business Machines Corporation Graphical identification of misbehaving systems
CN103595780B (zh) * 2013-11-08 2017-01-04 中国人民解放军理工大学 基于消重的云计算资源调度方法
US20160006640A1 (en) * 2013-11-12 2016-01-07 Hitachi, Ltd. Management computer, allocation management method, and non-transitory computer readable storage medium
CN103605574A (zh) * 2013-11-18 2014-02-26 浪潮(北京)电子信息产业有限公司 一种服务器集群中的虚拟机资源调度方法及系统
JP2015119472A (ja) * 2013-11-18 2015-06-25 株式会社リコー 選択システム、通信管理システム、通信システム、プログラム、及び選択方法
CN103684916A (zh) * 2013-12-13 2014-03-26 国家计算机网络与信息安全管理中心 一种云计算下智能监控分析方法及系统
US10104169B1 (en) 2013-12-18 2018-10-16 Amazon Technologies, Inc. Optimizing a load balancer configuration
CN103812949B (zh) * 2014-03-06 2016-09-07 中国科学院信息工程研究所 一种面向实时云平台的任务调度与资源分配方法及系统
CN103902384B (zh) * 2014-03-28 2017-08-11 华为技术有限公司 为虚拟机分配物理机的方法及装置
CN104301241B (zh) * 2014-06-05 2018-01-09 中国人民解放军信息工程大学 一种soa动态负载分发方法与系统
CN105335229B (zh) * 2014-07-25 2020-07-07 新华三技术有限公司 一种业务资源的调度方法和装置
CN104133727A (zh) * 2014-08-08 2014-11-05 成都致云科技有限公司 基于实时资源负载分配的方法
CN104270416B (zh) * 2014-09-12 2018-03-13 杭州华为数字技术有限公司 负载均衡控制方法及管理节点
CN104270418B (zh) * 2014-09-15 2017-09-15 中国人民解放军理工大学 面向用户需求Deadline的云代理预约分配方法
US9871855B2 (en) * 2014-09-19 2018-01-16 Facebook, Inc. Balancing load across cache servers in a distributed data store
CN104375897B (zh) * 2014-10-27 2018-02-27 西安工程大学 基于最小相对负载不均衡度的云计算资源调度方法
US10097448B1 (en) 2014-12-18 2018-10-09 Amazon Technologies, Inc. Routing mode and point-of-presence selection service
CN104580440A (zh) * 2014-12-29 2015-04-29 芜湖乐锐思信息咨询有限公司 利于资源优化配置的产品协作开发系统及方法
CN104581227A (zh) * 2014-12-31 2015-04-29 银江股份有限公司 一种基于任务调度的流媒体负载均衡方法
US10225326B1 (en) 2015-03-23 2019-03-05 Amazon Technologies, Inc. Point of presence based data uploading
US9875169B2 (en) * 2015-03-26 2018-01-23 Ca, Inc. Modeling real capacity consumption changes using process-level data
CN104750542B (zh) * 2015-04-22 2018-01-16 成都睿峰科技有限公司 一种基于云平台的数据迁移方法
CN104750541B (zh) * 2015-04-22 2018-01-16 成都睿峰科技有限公司 一种虚拟机迁移方法
CN104794098B (zh) * 2015-04-28 2017-05-10 湖北邮电规划设计有限公司 一种数据中心物理主机及存储设计方法及系统
US9832141B1 (en) 2015-05-13 2017-11-28 Amazon Technologies, Inc. Routing based request correlation
US9846589B2 (en) 2015-06-04 2017-12-19 Cisco Technology, Inc. Virtual machine placement optimization with generalized organizational scenarios
CN105162844B (zh) * 2015-08-05 2018-07-13 中国联合网络通信集团有限公司 一种任务分配的方法及装置
CN105208119B (zh) * 2015-09-21 2018-06-22 重庆大学 一种云数据中心任务分配方法、装置和系统
CN105373430A (zh) * 2015-10-13 2016-03-02 惠州Tcl移动通信有限公司 一种动态分配编译机的系统及其方法
CN111953732B (zh) * 2015-11-10 2023-03-28 华为技术有限公司 一种云计算系统中的资源调度方法及装置
US10270878B1 (en) 2015-11-10 2019-04-23 Amazon Technologies, Inc. Routing for origin-facing points of presence
CN105959252A (zh) * 2015-11-12 2016-09-21 杭州迪普科技有限公司 处理会话日志的方法及装置
CN105491138B (zh) * 2015-12-15 2020-01-24 国网智能电网研究院 一种基于负载率分级触发的分布式负载调度方法
US10284592B1 (en) 2015-12-17 2019-05-07 Architecture Technology Corporation Application randomization mechanism
US10200401B1 (en) 2015-12-17 2019-02-05 Architecture Technology Corporation Evaluating results of multiple virtual machines that use application randomization mechanism
US10412116B1 (en) 2015-12-17 2019-09-10 Architecture Technology Corporation Mechanism for concealing application and operation system identity
US10412114B1 (en) 2015-12-17 2019-09-10 Architecture Technology Corporation Application randomization mechanism
US10007498B2 (en) 2015-12-17 2018-06-26 Architecture Technology Corporation Application randomization mechanism
US10200406B1 (en) 2015-12-17 2019-02-05 Architecture Technology Corporation Configuration of application randomization mechanism
RU2632125C1 (ru) * 2016-04-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система обработки задач в облачном сервисе
US10075551B1 (en) 2016-06-06 2018-09-11 Amazon Technologies, Inc. Request management for hierarchical cache
US10110694B1 (en) 2016-06-29 2018-10-23 Amazon Technologies, Inc. Adaptive transfer rate for retrieving content from a server
CN107562531B (zh) * 2016-06-30 2020-10-09 华为技术有限公司 一种数据均衡方法和装置
CN106445629B (zh) * 2016-07-22 2019-05-21 平安科技(深圳)有限公司 一种负载均衡的方法及其装置
CN106101276B (zh) * 2016-08-10 2019-07-09 东方网力科技股份有限公司 一种集群负载均衡方法及装置
CN106371893A (zh) * 2016-08-31 2017-02-01 开封大学 一种云计算调度系统和方法
US10505961B2 (en) 2016-10-05 2019-12-10 Amazon Technologies, Inc. Digitally signed network address
US10831549B1 (en) 2016-12-27 2020-11-10 Amazon Technologies, Inc. Multi-region request-driven code execution system
US10938884B1 (en) 2017-01-30 2021-03-02 Amazon Technologies, Inc. Origin server cloaking using virtual private cloud network environments
CN106886478A (zh) * 2017-02-22 2017-06-23 郑州云海信息技术有限公司 一种数据过滤方法及监控服务器
CN106790726B (zh) * 2017-03-30 2020-08-11 电子科技大学 一种基于Docker云平台的优先级队列动态反馈负载均衡资源调度方法
US10554685B1 (en) 2017-05-25 2020-02-04 Architecture Technology Corporation Self-healing architecture for resilient computing services
US11075987B1 (en) 2017-06-12 2021-07-27 Amazon Technologies, Inc. Load estimating content delivery network
CN107291389A (zh) * 2017-06-16 2017-10-24 郑州云海信息技术有限公司 一种存储策略智能触发执行的方法和装置
CN107273185B (zh) * 2017-06-19 2020-09-29 观典防务技术股份有限公司 一种基于虚拟机的负载均衡控制方法
CN107566443A (zh) * 2017-07-12 2018-01-09 郑州云海信息技术有限公司 一种分布式资源调度方法
US10742593B1 (en) 2017-09-25 2020-08-11 Amazon Technologies, Inc. Hybrid content request routing system
US10616318B1 (en) * 2017-11-28 2020-04-07 Amazon Technologies, Inc. Load balancer employing slow start, weighted round robin target selection
CN109936606A (zh) * 2017-12-18 2019-06-25 浙江宇视科技有限公司 任务分配方法和装置
CN108259568B (zh) * 2017-12-22 2021-05-04 东软集团股份有限公司 任务分配方法、装置、计算机可读存储介质及电子设备
CN108710540B (zh) * 2018-05-23 2021-05-04 深信服科技股份有限公司 一种分布式集群中的资源调度方法、装置及设备
CN110727392B (zh) * 2018-07-17 2023-07-14 阿里巴巴集团控股有限公司 一种云存储数据单元调度方法和装置
CN108984273A (zh) * 2018-07-23 2018-12-11 郑州云海信息技术有限公司 一种虚拟机调度的方法及装置
CN109067867A (zh) * 2018-07-30 2018-12-21 北京航空航天大学 面向数据中心负载监控的虚拟化容器服务弹性伸缩方法
CN109377408A (zh) * 2018-09-29 2019-02-22 青海大学 一种提高可再生能源利用率的资源调度方法及系统
US10862852B1 (en) 2018-11-16 2020-12-08 Amazon Technologies, Inc. Resolution of domain name requests in heterogeneous network environments
US11025747B1 (en) 2018-12-12 2021-06-01 Amazon Technologies, Inc. Content request pattern-based routing system
US11579908B2 (en) * 2018-12-18 2023-02-14 Vmware, Inc. Containerized workload scheduling
US12271749B2 (en) 2019-04-25 2025-04-08 VMware LLC Containerized workload scheduling
CN110505195A (zh) * 2019-06-26 2019-11-26 中电万维信息技术有限责任公司 虚拟主机的部署方法以及系统
CN110795208B (zh) * 2019-10-11 2023-05-05 南京航空航天大学 基于改进粒子群的移动云计算自适应虚拟机调度方法
CN111580955A (zh) * 2020-04-03 2020-08-25 上海非码网络科技有限公司 计算机利用率智能分析系统及方法
WO2021207926A1 (zh) * 2020-04-14 2021-10-21 深圳市欢太科技有限公司 确定内存的方法、统计服务器、物理机和存储介质
CN111752710B (zh) * 2020-06-23 2023-01-31 中国电力科学研究院有限公司 数据中心pue动态优化方法、系统、设备及可读存储介质
WO2022018466A1 (en) * 2020-07-22 2022-01-27 Citrix Systems, Inc. Determining server utilization using upper bound values
CN114064191B (zh) * 2020-07-30 2025-03-18 中移(苏州)软件技术有限公司 资源调度方法及装置、设备、存储介质
CN114077524A (zh) * 2020-08-07 2022-02-22 展讯半导体(南京)有限公司 算力共享异常上报、处理方法及装置、存储介质、终端设备
CN111836139B (zh) * 2020-09-14 2020-12-08 南京嘉环科技股份有限公司 Otn环形网络业务优化方法、计算机系统与服务器
CN114461332B (zh) * 2020-11-09 2024-05-28 上海大学 一种基于应用特征的虚拟机部署方法
CN112733401B (zh) * 2020-12-30 2024-03-12 杭州电子科技大学 面向反应堆堆芯组件数值模拟的有限元撕裂对接法及系统
CN112579280B (zh) * 2020-12-30 2022-11-29 奇瑞汽车股份有限公司 云资源的调度方法、装置及计算机存储介质
CN113626282B (zh) * 2021-07-16 2023-12-22 济南浪潮数据技术有限公司 云计算物理节点负载监控方法、装置、终端及存储介质
CN113641124B (zh) * 2021-08-06 2023-03-10 珠海格力电器股份有限公司 一种算力分配方法、装置、控制器及楼宇控制系统
CN113806089B (zh) * 2021-09-17 2023-06-27 中国联合网络通信集团有限公司 集群负载资源调度方法、装置、电子设备及可读存储介质
US12430172B2 (en) * 2021-09-22 2025-09-30 Intel Corporation Resource management controller
CN114185488B (zh) * 2021-11-29 2024-07-26 江苏钟吾大数据发展集团有限公司 一种大数据集群的存储优化方法及系统
CN113867973B (zh) * 2021-12-06 2022-02-25 腾讯科技(深圳)有限公司 资源分配的方法和装置
CN114546602B (zh) * 2022-03-22 2025-09-05 阿里巴巴(中国)有限公司 虚拟机调度方法及装置
CN115242797B (zh) * 2022-06-17 2023-10-27 西北大学 一种面向微服务架构的客户端负载均衡方法及系统
US20240020172A1 (en) * 2022-07-14 2024-01-18 International Business Machines Corporation Preventing jitter in high performance computing systems
CN115827179B (zh) * 2022-09-15 2023-08-18 江西锋铄新能源科技有限公司 一种物理机设备的算力调度方法、装置、设备及存储介质
CN116737394B (zh) * 2023-08-14 2023-10-27 中海智(北京)科技有限公司 一种动态调整的安检集中判图任务分配方法
CN116880965B (zh) * 2023-09-08 2024-02-09 苏州浪潮智能科技有限公司 一种节点分配方法、系统、装置及介质
CN117407143B (zh) * 2023-10-27 2024-07-12 北京德仕美通电子有限公司 一种基于云计算的数据中心管理系统
CN117272329A (zh) * 2023-11-21 2023-12-22 明阳时创(北京)科技有限公司 一种基于分布式虚拟化漏洞扫描方法及系统
CN117891618B (zh) * 2024-03-15 2024-05-24 杭州宇泛智能科技有限公司 人工智能模型训练平台的资源任务处理方法及装置
CN119227976B (zh) * 2024-12-03 2025-03-25 中科云谷科技有限公司 用于仓储工作站的订单分配方法及其装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101309208A (zh) * 2008-06-21 2008-11-19 华中科技大学 一种适用于网格环境的基于可靠性代价的作业调度系统
CN101504620A (zh) * 2009-03-03 2009-08-12 华为技术有限公司 一种虚拟化集群系统负载平衡方法、装置及系统
CN101639793A (zh) * 2009-08-19 2010-02-03 南京邮电大学 一种基于支持向量回归机的网格负载预测方法
US7669029B1 (en) * 2006-11-15 2010-02-23 Network Appliance, Inc. Load balancing a data storage system

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109638A (ja) * 1999-10-06 2001-04-20 Nec Corp 推定伸長率に基づくトランザクション負荷分散方法及び方式並びにコンピュータ可読記録媒体
US7213065B2 (en) * 2001-11-08 2007-05-01 Racemi, Inc. System and method for dynamic server allocation and provisioning
KR100715674B1 (ko) * 2005-09-15 2007-05-09 한국전자통신연구원 부하 분산 방법 및 장치, 그리고 이를 이용한 소프트웨어스트리밍 시스템
EP2193484A4 (en) * 2007-08-31 2011-12-21 Cirba Inc METHOD AND SYSTEM FOR EVALUATING VIRTUALIZED ENVIRONMENTS
JP4906686B2 (ja) * 2007-11-19 2012-03-28 三菱電機株式会社 仮想マシンサーバサイジング装置及び仮想マシンサーバサイジング方法及び仮想マシンサーバサイジングプログラム
US8051174B2 (en) * 2008-03-03 2011-11-01 Microsoft Corporation Framework for joint analysis and design of server provisioning and load dispatching for connection-intensive server
US8230069B2 (en) * 2008-03-04 2012-07-24 International Business Machines Corporation Server and storage-aware method for selecting virtual machine migration targets
US8849971B2 (en) * 2008-05-28 2014-09-30 Red Hat, Inc. Load balancing in cloud-based networks
US8464267B2 (en) * 2009-04-10 2013-06-11 Microsoft Corporation Virtual machine packing method using scarcity
US8489744B2 (en) * 2009-06-29 2013-07-16 Red Hat Israel, Ltd. Selecting a host from a host cluster for live migration of a virtual machine
US9116731B2 (en) * 2010-04-07 2015-08-25 Accenture Global Services Limited Cloud reference model framework

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7669029B1 (en) * 2006-11-15 2010-02-23 Network Appliance, Inc. Load balancing a data storage system
CN101309208A (zh) * 2008-06-21 2008-11-19 华中科技大学 一种适用于网格环境的基于可靠性代价的作业调度系统
CN101504620A (zh) * 2009-03-03 2009-08-12 华为技术有限公司 一种虚拟化集群系统负载平衡方法、装置及系统
CN101639793A (zh) * 2009-08-19 2010-02-03 南京邮电大学 一种基于支持向量回归机的网格负载预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Aameek Singh et al..Server-Storage Virtualization: Integration and Load Balancing in Data Centers.《International Conference for High Performance Computing,Networking,Storage and Analysis,2008.SC 2008》.2008,全文.
Server-Storage Virtualization: Integration and Load Balancing in Data Centers;Aameek Singh et al.;《International Conference for High Performance Computing,Networking,Storage and Analysis,2008.SC 2008》;20081121;全文 *
WEB服务器集群系统中负载平衡的设计与实现;郑洪源等;《南京航空航天大学学报》;20060630;第38卷(第3期);第349页第1栏第12-14、30-32行,第2栏第16-20、26、36-39行,第350页第1栏第14-25行 *
郑洪源等.WEB服务器集群系统中负载平衡的设计与实现.《南京航空航天大学学报》.2006,第38卷(第3期),

Also Published As

Publication number Publication date
CN102232282A (zh) 2011-11-02
US20120204176A1 (en) 2012-08-09
WO2011110026A1 (zh) 2011-09-15
US8510747B2 (en) 2013-08-13

Similar Documents

Publication Publication Date Title
CN102232282B (zh) 一种实现数据中心资源负载均衡的方法及装置
EP3847549B1 (en) Minimizing impact of migrating virtual services
Oleghe Container placement and migration in edge computing: Concept and scheduling models
CN102185779B (zh) 与综合配置能力成比例的数据中心资源负载均衡的方法及装置
Han et al. Lightweight resource scaling for cloud applications
CN109684074B (zh) 物理机资源分配方法及终端设备
CN109542603B (zh) 一种提高不同优先级任务间隔离性的多维资源隔离系统
Zhang et al. Dynamic heterogeneity-aware resource provisioning in the cloud
CN103793272B (zh) 一种周期性任务调度方法及系统
CN105491138B (zh) 一种基于负载率分级触发的分布式负载调度方法
US11496413B2 (en) Allocating cloud computing resources in a cloud computing environment based on user predictability
CN105245617A (zh) 一种基于容器的服务器资源供给方法
CN102185759A (zh) 一种满足需求特性的多物理服务器负载均衡的方法及装置
Singh et al. A comprehensive review of cloud computing virtual machine consolidation
Shahapure et al. Virtual machine migration based load balancing for resource management and scalability in cloud environment
Wang et al. An adaptive model-free resource and power management approach for multi-tier cloud environments
CN119557067B (zh) 多云场景下算力资源协同调度方法、装置及存储介质
CN114327905A (zh) 负载均衡方法、装置及计算机设备
Gohil et al. A comparative analysis of virtual machine placement techniques in the cloud environment
HoseinyFarahabady et al. Data-intensive workload consolidation in serverless (Lambda/FaaS) platforms
CN109697105A (zh) 一种容器云环境物理机选择方法及其系统、虚拟资源配置方法及迁移方法
Paulos et al. Priority-enabled load balancing for dispersed computing
CN118605886A (zh) 容器应用部署方法、装置、电子设备及存储介质
Runsewe et al. Cram: a container resource allocation mechanism for big data streaming applications
Kim et al. Design of the cost effective execution worker scheduling algorithm for faas platform using two-step allocation and dynamic scaling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant