以下是最近对于云计算中微服务系统调度论文的泛读,欢迎一起探讨问题,如需要论文请私聊。


Amoeba: QoS-Awareness and Reduced Resource Usage of Microservices with Serverless Computing

问题:微服务在IaaS模式部署与无服务器模式部署的切换问题

目标:最大限度的减少资源使用,同时保持微服务的服务质量

构成:混合执行引擎+多资源竞争监视器+竞争感知部署器

原理:争用监视器定期检查共享资源的状态,部署控制器通过性能模型确定何时切换并预测QoS,执行引擎负责切换

亮点:将查询排队时间以及判别函数公式化、预热容器、可以通过离线数据计算容器的处理能力

Idea


ATOM: Model-Driven Autoscaling for Microservices

问题缺乏旨在利用微服务架构的独特功能的自动扩展方法

目标:用自动缩放的方法优化微服务场景的性能

构成:负载监视器+负载分析器+缩放规划器+执行器

原理:通过监控数据实例化分层排队网络,使用遗传算法求出最优解

亮点:分层排队网络、发现关键问题的线性关系

Idea


Incentivizing Microservices for Online Resource Sharing in Edge Clouds

问题:边缘云容量很小,微服务的资源分配问题难以解决

目标:为边缘云提供一种资源分配的方法

构成:在线需求估计+赢家选择+在线算法设计

原理:微服务报告其资源需求,卖方提出价格,赢家选择

亮点:把微服务需求公式化

Idea


CLITE: Efficient and QoS-Aware Co-location of Multiple Latency-Critical Jobs for Warehouse Scale Computers

问题:多个LC作业与多个BG作业共置的资源分配问题

目标:最大化同时运行的LC作业的数量且满足其QoS,最大化BG作业的性能

构成:贝叶斯优化引擎

原理:建立初始化函数,用贝叶斯优化引擎进行优化,最后给出资源配置

亮点:贝叶斯优化、资源等价类、多资源配置

Idea


RAMBO: Resource Allocation for Microservices Using Bayesian Optimization

问题:解决大资源配置空间搜索问题

目标:解决微服务应用的资源配置,增加资源利用率

构成:优化服务器+Kubernetes集群操作

原理:优化服务器产生配置,控制节点申请配置,并衡量性能和成本,再向优化器报告真是度量

亮点:多资源配置、贝叶斯优化、双目标问题

Idea


FIRM: An Intelligent Fine-grained Resource Management Framework for SLO-Oriented Microservices

问题:微服务之间有效的复用共享资源以减少SLO违规

目标:在有效复用共享资源的同时缓解SLO违规

构成:跟踪协调器+提取器+资源评估器+部署模块+异常注入器

原理:提取器根据跟踪协调器提供的数据产生CP,并定位关键微服务,资源评估器对关键微服务进行重新分配资源,

    部署模块根据决策进行部署,异常注入器在工作时注入异常,强化模型学习。

亮点:CP&关键微服务的找出、异常注入器的培训、迁移学习的使用

Idea 


GrandSLAm: Guaranteeing SLAs for Jobs in Microservices Execution Frameworks

问题:多租户情境下,实现微服务的高吞吐量和高资源利用率

目标:在满足微服务的QoS的同时,最大化吞吐量

构成:请求松弛计算+排序+批处理

原理:生成微服务应用的DAG,对请求进行松弛度计算,按松弛度排序,动态的批处理运行

亮点DAG、松弛度计算、动态批处理、共享程度与延迟之间的线性关系、松弛转移

Idea


PARTIES: QoS-Aware Resource Partitioning for Multiple Interactive Services

问题:多租户模式下,多个LC作业与多个BE作业共置的资源分配问题

目标:为多个LC应用在满足QoS的前提下,和BE作业共享资源

构成:资源监控+调整资源(资源产生+动作产生)

原理:通过资源监控,对违规最严重的微服务进行多资源配置,确定放缩操作,然后确定资源,再进行新轮次的监控

亮点:多资源循环配置、资源敏感度的初步探索、资源的可替代性

Idea


Sinan: ML-Based and QoS-Aware Resource Management for Cloud Microservices

问题:微服务之间的依赖关系增加了尾部延迟,复杂的拓扑结构加剧了排队效应,并引入了QoS违规

目标:合理分配资源的同时不违反QoS

构成:集中调度器+预测服务器+分布式操作器

原理:请求到达后,Docker汇报信息,搭建模型输入到预测器,预测器产生资源配置并分配

亮点:CNN预测端到端的尾部延迟、增强树预测QoS违反的概率、少量数据再学习可以用于新环境

Idea


Towards QoS-Aware and Resource-Efficient GPU Microservices Based on Spatial Multitasking GPUs In Datacenters

问题:保证GPU微服务QoS的同时优化资源利用率

目标:保证GPU上微服务QoS的同时最大化资源利用率或最大化吞吐量

构成:竞争感知资源分配器+基于内存的全局通信+程池

原理:微服务到达后,批处理进入Camelot,性能模型产生两种策略 ,将资源配置发送到进程池,然后进行资源分配

亮点:基于全局的通信机制、两种分配策略

Idea


Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐