• 对系统故障处理的思考

    4.通过上面的几步已经基本确定故障了,下来尽快恢复系统正常运行,然后再慢慢分析故障原因。5.通过查找上面时间点的系统故障日志,基本会看到相关的错误信息的,如调用了那个数据库对象、返回了什么oracle的错误、写...
    文章 2017-11-14 934浏览量
  • 高德服务单元化方案和架构实践

    通过日志分析出用户所属大区后,我们将不同分组做成多个布隆过滤器,计算时逐层过滤。这个计算有两种特殊情况: 1)因为BloomFilter存在误算率,有可能存在一种情况,华南分组的用户被计算到华北了,这种情况比例在...
    文章 2019-11-25 7970浏览量
  • Storm(实时分布式大数据处理系统)简介

    主节点通常运行一个后台程序 —— Nimbus,用于响应分布在集群中的节点,分配任务和监测故障。这个很类似于Hadoop中的Job Tracker。工作节点 工作节点叫worker,一般就是集群中的一个节点,也就是一个计算机。它同样...
    文章 2015-04-17 1805浏览量
  • 电商网站数据分析的重要性

    另外,你可能有一个设计缺陷,导致故障在用户的体验,这需要找到和解决的时候了。了解你的转换率 Analytics(分析)的电子商务涉及很多标注,它可以通过谷歌的程序或不同的解析程序来完成。这些标签更高效,可以放置...
    文章 2015-12-30 1995浏览量
  • Linux故障排除速查表:strace,htop,lsof,tcpdump,...

    sysdig/csysdig不仅可以滚动浏览单个表,还可以深入“连接视图”以查看其他分组(例如,每个容器或每个线程)中的数据。Linux故障排除备忘单:strace,htop,lsof,tcpdump,iftop和sysdig https://t.co/XeIeAwwj9i ...
    文章 2019-09-29 969浏览量
  • 天津茶叶交易中心成为美信云网管客户

    美信云网管还允许自定义告警的范围、条件、升级、相关性以及告警分组,帮助天茶交易中心的IT运维人员快速定位故障,查找故障原因。美信云网管的告警依靠策略会有效地屏蔽错报和误报,防止告警泛滥,保证告警的真实...
    文章 2017-09-26 2326浏览量
  • DockOne微信分享(一零七):SRE工程实践——基于时间...

    当系统无法自动修复某个问题时,需要一个人来调查这项警报,以决定目前是否存在真实故障,采取一定方法缓解故障,分析故障现象,最终找出导致故障原因。监控系统应该从两个方面提供故障的信息,即现象和原因。黑盒...
    文章 2017-10-12 1976浏览量
  • 钉钉成功案例分析

    消息过滤,将过滤无新消息的会话,避免信息过载;分组管理,支持新建绘画分组和优先级排序,高效管理重要项目和联系人 云计算的优势什么是云计算?云计算是通过网络按需分配计算资源。计算资源包括服务器、数据库、...
    文章 2020-12-02 1668浏览量
  • 云计算与钉钉相结合——钉钉成功案例分析

    消息过滤,将过滤无新消息的会话,避免信息过载;分组管理,支持新建绘画分组和优先级排序,高效管理重要项目和联系人 云计算的优势 什么是云计算?云计算是通过网络按需分配计算资源。计算资源包括服务器、数据库、...
    文章 2020-09-28 1006浏览量
  • 云计算与钉钉相结合——钉钉成功案例分析

    消息过滤,将过滤无新消息的会话,避免信息过载;分组管理,支持新建绘画分组和优先级排序,高效管理重要项目和联系人 云计算的优势 什么是云计算?云计算是通过网络按需分配计算资源。计算资源包括服务器、数据库、...
    文章 2020-09-28 406浏览量
  • 轻量级数据库中间件利器Sharding-JDBC深度解析(有...

    讲师介绍 张亮 当当架构部总监 负责分布式中间件和私有云平台建设 目前主导开源项目:...分页归并会将改写的LIMIT中,不需要获取的数据过滤掉。Sharding-JDBC的分页很容易产生误解,很多人认为分页会占用大量内存,...
    文章 2017-08-02 1394浏览量
  • Tomcat配置文件Server.xml作用介绍

    Server.xml文件中的每个主要元素都会创建软件“对象”、排序及进程管道中设置的这些元素嵌套方,让您能执行过滤分组等工作。示例:Tomcat 6.0的简单server.xml文件 type="org.apache.catalina.UserDatabase...
    文章 2011-06-07 547浏览量
  • Fabric Kafka共识原理解析

    这就是代理如何确定应当使用哪个分区领导者的原因。zookeeper有超强的故障容错能力,因此Kafka的运行严重依赖于它。在zookeeper中存储的元数据包括: 消费者分组在每个分区的读取偏移量 访问控制清单,用于访问授权...
    文章 2019-04-25 3603浏览量
  • 云服务器 ECS 学习笔记

    至于 ECS 实例内由于病毒感染、人为误删除或黑客入侵等软故障原因造成的数据丢失,需要采用备份、快照等技术手段来解决。目前只要是相同地域下,SLB、RDS、OSS 同 ECS 之间都是可以直接内网互通连接使用的 公网 IP ...
    文章 2017-06-26 6260浏览量
  • 蒋步星:轻量级大数据计算引擎

    近几年,大数据非常热门,大数据计算的方案也较多,目前,大数据计算机平台有很多,但却越来越沉重,主要是由于这三个方面的原因: 并不是任何事物都需要沉重的大数据平台,许多还是需要轻量级计算。轻量级计算需求 ...
    文章 2017-11-15 3227浏览量
  • 对 K8s 异常事件的定时 SQL 分析

    分析预览在 k8s-event 日志库上,过滤 Normal 级别事件,按照 namespace、object 类型、事件类型分组统计:关联的 object 数目、事件数目、关联的节点数目。SQL 代码如下:*not level:Normal|select"eventId....
    文章 2021-08-03 230浏览量
  • 网易云基于Kubernetes+Docker的容器服务研发实践

    优化:所有资源按用户分组,全并行调度,集群规模再大也能瞬间调度 副本控制器多优先级处理 问题:原生controller对副本的增量的增/删/改和全量定时任务单队列处理 优化:增加多优先级队列(Add>Update>Delete&...
    文章 2017-05-16 3440浏览量
  • React 官方发布性能分析插件Profiler

    DevTools Profiler 通过“commits(提交)”对性能信息进行分组。commits(提交)显示在 Profiler 顶部附近的条形图中: 图表中的每个竖条表示一次 commit(提交),当前选中的 commit(提交)颜色为黑色。可以通过单击竖条...
    文章 2019-08-06 1169浏览量
  • 《自顶向下网络设计(第3版)》——2.3 网络性能

    引起数据错误的典型原因包括电源电涌或尖脉冲、阻抗不匹配、质量低劣的物理连接、设备失效或由电气设备引起的噪声等。虽然软件问题所引起的错误不如物理层那么普遍,但有时软件中的缺陷也可能引起数据错误。数据帧...
    文章 2017-05-02 2029浏览量
  • 稳定性专题|通过链路追踪快速发现和定位业务问题的...

    『StabilityGuide』是阿里多位阿里技术工程师共同发起的稳定性领域的知识库开源项目,涵盖性能压测、故障演练、JVM、应用容器、服务框架、流量调度、监控、诊断等多个技术领域,以更结构化的方式来打造稳定性领域的...
    文章 2020-01-20 5445浏览量
  • 3+1保障:高可用系统稳定性是如何炼成的?

    数据一致性在分布式处理以及微服务化后,相关联的数据会存在于不同的系统之中,相关联的数据库表、数据存储、缓存等数据会因为架构设计或子系统抖动故障失败等原因,导致彼此数据出现不一致,这也是一类稳定性故障。...
    文章 2021-01-27 8367浏览量
  • 深度解读!时序数据库HiTSDB:分布式流式聚合引擎

    GroupedAggOp:需要插值,但是输入算子能够保证已经将时间线的ID根据标识(tags)进行排序分组,这样在流水线处理中,只要materialize最多一个组的数据,这样的算子比起内存保留所有分组时间线,内存要求要低,同时支持...
    文章 2018-04-19 4372浏览量
  • 《云安全原理与实践》——2.1 云计算面临的技术风险

    针对这种攻击,主要的防御方式是通过入侵检测、流量过滤和多重验证,将堵塞网络带宽的流量过滤,放行正常的流量。2)中间人攻击:是指攻击者通过拦截正常的网络通信数据,并进行数据篡改和嗅探,而通信的双方却毫不...
    文章 2017-09-04 2786浏览量
  • 一个秒杀系统的设计思考

    系统隔离是运行时隔离,通过分组部署和另外 99%进行分离,另外秒杀也可以申请单独的域名,入口层就让请求落到不同的集群中3.数据隔离。秒杀数据作为热点数据,可以启用单独的缓存集群或者 DB 服务组,从而更好的实现...
    文章 2020-06-23 1646浏览量
  • 有效运维的 on-call 机制

    以相似度来说:首先采集告警的多维度信息,包括时间、主机、服务、分组hostgroups、应用applications、标签tags等基本维度信息,计算不同告警之间相似度,如果达到阈值,如告警A和告警B有70%相似就关联起来。...
    文章 2016-06-20 3447浏览量
  • 高可用互联网系统稳定性建设实践指南

    相关联的数据库表、数据存储、缓存等数据会因为架构设计或子系统抖动故障失败等原因导致彼此数据出现不一致&xff0c;这也是一类稳定性故障。最简单一致性问题就是关系型数据库的同请求内同库相关联多个数据表更新的...
    文章 2021-09-01 62浏览量
  • AI时代的全链路监控,阿里工程师怎么做?

    横向业务维度:业务全链路监控提供了“横向业务维度”功能,能够方便的配置“业务身份”、“商家”、“门店”等特定的业务维度,可以对一个业务域中所有的“业务活动”和“系统服务”按一个维度过滤,比如可以对交易...
    文章 2018-08-29 9466浏览量
  • 技术解读|完整揭秘网络领域顶会SIGCOMM'20论文 阿里...

    当VTraceTaskBolt被任务激活时,就开始收集任务相关的日志数据,对日志数据进行预处理(即过滤,转换,和分组),然而,不同日志源的日志到达Bolt的时间无法保证和转发的时序性完全一致,由于可能存在NAT转换,数据...
    文章 2020-06-10 1214浏览量
  • MySQL架构优化实战系列2:主从复制同步与查询性能调优

    表明同步出现了故障,可能是slave服务器执行了写操作或者从服务器重启有事务回滚操作。解决 从服务器:stop slave?关闭复制线程 主服务器:show master status?查看最新二进制文件和位置偏移量 从服务器执行:...
    文章 2017-05-02 2216浏览量
  • 技术解读|完整揭秘通信领域顶会SIGCOMM 20’论文 ...

    当VTraceTaskBolt被任务激活时,就开始收集任务相关的日志数据,对日志数据进行预处理(即过滤,转换,和分组),然而,不同日志源的日志到达Bolt的时间无法保证和转发的时序性完全一致,由于可能存在NAT转换,数据...
    文章 2020-06-10 169浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com