云计算中微服务相关论文泛读

以下是最近对于云计算中微服务系统调度论文的泛读，欢迎一起探讨问题，如需要论文请私聊。Amoeba: QoS-Awareness and Reduced Resource Usage of Microservices with Serverless Computing问题：微服务在IaaS模式部署与无服务器模式部署的切换问题目标：最大限度的减少资源使用，同时保持微服务的服务质量构成：混合执行引擎+多

Ever_glow

1337人浏览 · 2021-07-22 09:28:02

Ever_glow · 2021-07-22 09:28:02 发布

以下是最近对于云计算中微服务系统调度论文的泛读，欢迎一起探讨问题，如需要论文请私聊。

Amoeba: QoS-Awareness and Reduced Resource Usage of Microservices with Serverless Computing

问题：微服务在IaaS模式部署与无服务器模式部署的切换问题

目标：最大限度的减少资源使用，同时保持微服务的服务质量

构成：混合执行引擎+多资源竞争监视器+竞争感知部署器

原理：争用监视器定期检查共享资源的状态，部署控制器通过性能模型确定何时切换并预测QoS，执行引擎负责切换

亮点：将查询排队时间以及判别函数公式化、预热容器、可以通过离线数据计算容器的处理能力

Idea：

ATOM: Model-Driven Autoscaling for Microservices

问题：缺乏旨在利用微服务架构的独特功能的自动扩展方法

目标：用自动缩放的方法优化微服务场景的性能

构成：负载监视器+负载分析器+缩放规划器+执行器

原理：通过监控数据实例化分层排队网络，使用遗传算法求出最优解

亮点：分层排队网络、发现关键问题的线性关系

Idea：

Incentivizing Microservices for Online Resource Sharing in Edge Clouds

问题：边缘云容量很小，微服务的资源分配问题难以解决

目标：为边缘云提供一种资源分配的方法

构成：在线需求估计+赢家选择+在线算法设计

原理：微服务报告其资源需求，卖方提出价格，赢家选择

亮点：把微服务需求公式化

Idea：

CLITE: Efficient and QoS-Aware Co-location of Multiple Latency-Critical Jobs for Warehouse Scale Computers

问题：多个LC作业与多个BG作业共置的资源分配问题

目标：最大化同时运行的LC作业的数量且满足其QoS，最大化BG作业的性能

构成：贝叶斯优化引擎

原理：建立初始化函数，用贝叶斯优化引擎进行优化，最后给出资源配置

亮点：贝叶斯优化、资源等价类、多资源配置

Idea：

RAMBO: Resource Allocation for Microservices Using Bayesian Optimization

问题：解决大资源配置空间搜索问题

目标：解决微服务应用的资源配置，增加资源利用率

构成：优化服务器+Kubernetes集群操作

原理：优化服务器产生配置，控制节点申请配置，并衡量性能和成本，再向优化器报告真是度量

亮点：多资源配置、贝叶斯优化、双目标问题

Idea：

FIRM: An Intelligent Fine-grained Resource Management Framework for SLO-Oriented Microservices

问题：微服务之间有效的复用共享资源以减少SLO违规

目标：在有效复用共享资源的同时缓解SLO违规

构成：跟踪协调器+提取器+资源评估器+部署模块+异常注入器

原理：提取器根据跟踪协调器提供的数据产生CP，并定位关键微服务，资源评估器对关键微服务进行重新分配资源，

部署模块根据决策进行部署，异常注入器在工作时注入异常，强化模型学习。

亮点：CP&关键微服务的找出、异常注入器的培训、迁移学习的使用

Idea：

GrandSLAm: Guaranteeing SLAs for Jobs in Microservices Execution Frameworks

问题：多租户情境下，实现微服务的高吞吐量和高资源利用率

目标：在满足微服务的QoS的同时，最大化吞吐量

构成：请求松弛计算+排序+批处理

原理：生成微服务应用的DAG，对请求进行松弛度计算，按松弛度排序，动态的批处理运行

亮点：DAG、松弛度计算、动态批处理、共享程度与延迟之间的线性关系、松弛转移

Idea：

PARTIES: QoS-Aware Resource Partitioning for Multiple Interactive Services

问题：多租户模式下，多个LC作业与多个BE作业共置的资源分配问题

目标：为多个LC应用在满足QoS的前提下，和BE作业共享资源

构成：资源监控+调整资源（资源产生+动作产生）

原理：通过资源监控，对违规最严重的微服务进行多资源配置，确定放缩操作，然后确定资源，再进行新轮次的监控

亮点：多资源循环配置、资源敏感度的初步探索、资源的可替代性

Idea：

Sinan: ML-Based and QoS-Aware Resource Management for Cloud Microservices

问题：微服务之间的依赖关系增加了尾部延迟，复杂的拓扑结构加剧了排队效应，并引入了QoS违规

目标：合理分配资源的同时不违反QoS

构成：集中调度器+预测服务器+分布式操作器

原理：请求到达后，Docker汇报信息，搭建模型输入到预测器，预测器产生资源配置并分配

亮点：CNN预测端到端的尾部延迟、增强树预测QoS违反的概率、少量数据再学习可以用于新环境

Idea：

Towards QoS-Aware and Resource-Efficient GPU Microservices Based on Spatial Multitasking GPUs In Datacenters

问题：保证GPU微服务QoS的同时优化资源利用率

目标：保证GPU上微服务QoS的同时最大化资源利用率或最大化吞吐量

构成：竞争感知资源分配器+基于内存的全局通信+进程池

原理：微服务到达后，批处理进入Camelot，性能模型产生两种策略，将资源配置发送到进程池，然后进行资源分配

亮点：基于全局的通信机制、两种分配策略

Idea：

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

多目标点路径规划——蚁群 + A* 算法解决室内旅行商问题

DAMO开发者矩阵

基于几何映射的二维自然图像到四维fMRI脑图像的迁移学习/文献速递-大模型与图像分割在医疗影像中应用

DAMO开发者矩阵

【第三十一周】具身智能体领域总结

目前这些文章的研究领域是属于具身智能领域，所谓具身智能，在我看来，就是让智能体脱离抽象分析的层面，将其寄托于一个“身体”上，机器人通过这个身体，就像人类一样，自主感知、理解世界，并且能够对于不同任务要求，能够自主导航、自主识别、自主生成与物体交互的动作序列，与现实世界进行直接的接触。这些论文分为三个研究方向：分别是智能体3D场景感知、智能体自主导航策略、手-物交互与动作生成，下面将分别阐述这三个方