• 对系统故障处理的思考

    上面写的只是日常故障的基本处理思路和影响sql性能的一些可能点,随着系统运行的时间加长,还有其它的问题出现,还挖掘更多的隐患,只有那样才能触进系统更加健康良好的运行。本文转自 149banzhang 51CTO博客,...
    文章 2017-11-14 933浏览量
  • 阿里HBase高可用8年“抗战”回忆录

    比如坏盘、网卡损坏、机器宕机等自身缺陷,一般指程序自身的bug或者性能瓶颈运维故障,由于不合理的操作导致的故障服务过载,突发热点、超大的对象、过滤大量数据的请求依赖失效,依赖的HDFS、Zookeeper组件出现不...
    文章 2019-11-04 3557浏览量
  • Apache Storm 官方文档 —— Trident 教程

    这些操作一般会输入一个“输入域”(input fields)集合,然后发送出一个“方法域”(function fields)的集合。输入域主要用于选取一个 tuple 的子集作为操作的输入,而“方法域”主要用于为该操作的输出结果域命名...
    文章 2016-04-01 1416浏览量
  • 阿里HBase高可用8年“抗战”回忆录

    比如坏盘、网卡损坏、机器宕机等自身缺陷,一般指程序自身的bug或者性能瓶颈运维故障,由于不合理的操作导致的故障服务过载,突发热点、超大的对象、过滤大量数据的请求依赖失效,依赖的HDFS、Zookeeper组件出现不...
    文章 2019-10-17 1788浏览量
  • Apache Storm 官方文档 —— Trident 教程

    这些操作一般会输入一个“输入域”(input fields)集合,然后发送出一个“方法域”(function fields)的集合。输入域主要用于选取一个 tuple 的子集作为操作的输入,而“方法域”主要用于为该操作的输出结果域命名...
    文章 2017-05-22 1372浏览量
  • 线上广告投放出现bug,如何实时发现?

    电商平台的搜索广告数据处理链路通常较长,一般会经历如下过程: 广告主在后台进行广告投放;投放广告品及关键词数据写入数据库;数据库中的数据通过全量构建(导入数据仓库再进行离线批处理)或增量构建(借助消息...
    文章 2019-12-29 1168浏览量
  • 一个秒杀系统的设计思考

    用户下单后,不一定实际付款,假设有 100 件商品,就可能出现 200 人下单成功的情况,因为下单时不会减库存,所以也就可能出现下单成功数远远超过真正库存数的情况,这尤其发生在大促的热门商品上。如此一来就...
    文章 2020-06-23 1638浏览量
  • 2020年MySQL数据库面试题总结(50道题含答案解析和...

    (1)读写分离(2)分段加锁(3)减少锁持有的时间(4)多个线程尽量以相同的顺序去获取资源不能将锁的粒度过于细化,不然可能会出现线程的加锁和释放次数过多,反而效率不如一次加一把大锁。27、索引的底层实现原理...
    文章 2020-08-17 3360浏览量
  • 3+1保障:高可用系统稳定性是如何炼成的?

    热点或极限值处理业务规模以及数据规模大的部分系统,在系统中会出现数据热点、数据极度倾斜、少量大客户超过极限阈值使用等极限场景,例如超级大客户广告投放物料、广告点击展示数据、API调用频次都是比普通客户大...
    文章 2021-01-27 8353浏览量
  • 高可用互联网系统稳定性建设实践指南

    在系统中会出现数据热点、数据极度倾斜、少量大客户超过极限阈值使用等极限场景&xff0c;例如超级大客户广告投放物料、广告点击展示数据、API调用频次都是比普通客户大很多&xff0c;如果按照客户维度分库分表&xff0c;基本...
    文章 2021-09-01 56浏览量
  • 钉钉前端-如何设计前端实时分析及报警系统

    一般我们碰到如下三种干扰日志&xff1a;第 1 个是第三方脚本注入第 2 个是容器脚本的注入第 3 个是由手机制造商脚本注入举个例子&xff0c;如上是我们线上的一个应用&xff0c;大概 js error 率是 0.08%xff0c;对于钉钉这样...
    文章 2021-05-20 354浏览量
  • 宜信微服务任务调度平台建设实践

    离线调度器一般都是出现问题了,可能是进程挂掉了,也可能是网络故障了。白名单:将某个IP加入白名单之后,它具有调用所有执行器实例的权限;白名单列表提供批量删除的功能,删除该IP后自动失去该权限。3.3 调度...
    文章 2019-10-22 1802浏览量
  • mysql面试问题总结

    一般这么回答完紧接着问mvcc的实现原理。mvcc全称多版本并发控制&xff0c;要知道他的概念是维护一个数据的多个版本&xff0c;来实现无锁的并发读写功能。mvcc实现依赖3个隐式字段&xff0c;undolog&xff0c;read view隐式...
    文章 2021-08-24 44浏览量
  • 阿里巴巴复杂搜索系统的可靠性优化之路

    当此机房出现比较严重的问题时,对上游业务影响非常大,甚至引发故障;鉴于此,对闲鱼商品搜索引擎的在线离线集群进行双机房部署容灾;在详细展开之前,我们先大致理解下Ha3引擎DUMP流程的原理;如上图所示,Ha3...
    文章 2019-03-19 13281浏览量
  • SLS:海量日志数据管理利器

    以文件轮转为例,轮转过程中会出现边界丢少量日志的情况,同时操作系统的不同行为、日志轮转方法(按大小或时间)、轮转参数(时间命名、顺序编号、压缩等)等都会将这个问题复杂化。为此我们在操作系统文件层面之上...
    文章 2016-12-25 10244浏览量
  • Flink 零基础实战教程:如何计算实时热门商品

    这里我们还使用了 ListState 来存储收到的每条 ItemViewCount 消息,保证在发生故障时,状态数据的不丢失和一致性。ListState 是 Flink 提供的类似 Java List 接口的 State API,它集成了框架的 checkpoint 机制,...
    文章 2019-06-20 1464浏览量
  • 《机器学习系统设计:Python语言实现》一1.2 设计...

    如果我们的算法用于装配线机器人,当它把人分类为产品组件发生什么?显然,对于关键系统,我们需要对失败进行计划。在我们的设计过程和系统中,应该具备健壮的故障和错误检测程序。有时,有必要只是为了调试和检查...
    文章 2017-05-02 2175浏览量
  • ProxySQL!像C罗一样的强大!

    像C罗一样的强大,可以实现读写分离,支持Query路由功能,支持动态指定某个SQL进行cache,支持动态加载配置、故障切换和一些SQL的过滤功能。还有一些同类产品比如DBproxy、MyCAT、OneProxy等。但经过反复对比和测试...
    文章 2019-07-02 1378浏览量
  • HBase内部结构

    如果block size配置的很小,就会产生很多block索引,这样会给内存带来很大的压力,将会取得与预期相反的效果,同时,由于压缩的数据很小,压缩效率也低,将会出现数据容量增大的情况 Data内部 Data数据块的第一位存储的是块...
    文章 2018-12-06 1377浏览量
  • 打造100%绝对安全的个人电脑

    (虽然一般黑客都会在走时清除他在你电脑中留下的痕迹,不过也有一些不小心的)打开管理工具?找到本地安全设置。本地策略。审核策略?1.审核策略更改 成功失败?2.审核登陆事件 成功失败?3.审核对象访问 失败?4...
    文章 2017-11-15 1333浏览量
  • SLS:海量日志数据管理利器

    以文件轮转为例,轮转过程中会出现边界丢少量日志的情况,同时操作系统的不同行为、日志轮转方法(按大小或时间)、轮转参数(时间命名、顺序编号、压缩等)等都会将这个问题复杂化。为此我们在操作系统文件层面之上...
    文章 2016-03-14 6674浏览量
  • 技术解读|完整揭秘网络领域顶SIGCOMM'20论文 阿里...

    目前该项技术已经在阿里云网络内部大规模普及,效果显著,大大减少了诊断时间,从人为处理的平均几小时下降到分钟级的耗时,现在它已经成为云网络故障排查必不可少的工具,未来将逐步开放给阿里云用户,让阿里云...
    文章 2020-06-10 1208浏览量
  • 技术解读|完整揭秘通信领域顶SIGCOMM 20’论文 ...

    目前该项技术已经在阿里云网络内部大规模普及,效果显著,大大减少了诊断时间,从人为处理的平均几小时下降到分钟级的耗时,现在它已经成为云网络故障排查必不可少的工具,未来将逐步开放给阿里云用户,让阿里云...
    文章 2020-06-10 1475浏览量
  • 技术解读|完整揭秘通信领域顶SIGCOMM 20’论文 ...

    目前该项技术已经在阿里云网络内部大规模普及,效果显著,大大减少了诊断时间,从人为处理的平均几小时下降到分钟级的耗时,现在它已经成为云网络故障排查必不可少的工具,未来将逐步开放给阿里云用户,让阿里云...
    文章 2020-06-10 164浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    除分片字段外,Schemaless还支持相等、不等以及范围查询的过滤器,同时支持只查询索引字段的一个子集以及根据索引实体指向的row key获取特定列或所有列。现在分片字段必须是不可修改的,因此Schemaless只需跟一个分...
    文章 2017-05-02 1861浏览量
  • 面试题有哪些

    特点及应用性能较高,所以单片机、嵌入式开发等一般采用面向过程开发。面向对象 是什么是把构成问题的事务分解成各个对象,而建立对象的目的也不是为了完成一个个步骤,而是为了描述某个事物在解决整个问题的过程中...
    文章 2021-10-07 14浏览量
  • Mongodb Manual阅读笔记:CH8 复制集

    复制提供了融合和高可用,多个数据拷贝放在不同的数据服务上,以免出现单点故障,就算出现硬件错误也可以恢复,当出现问题的时候,只要把其中一个拷贝来替换原来的即可。有时候也可以使用复制,来做读写分离,客户端...
    文章 2014-03-21 1364浏览量
  • 深度|大数据算法应用的测试发展之路

    总所周知,对于一个搜索或者广告的在线计算引擎,其内部的数据在不停地发生更新,或者出于商家在商品信息上的变更,也可能是因为广告主在创意甚至投放计划上的变化,这些更新需要实时反馈在投放引擎,否则会出现信息...
    文章 2020-04-30 7781浏览量
  • 带你读《增强型分析:AI驱动的数据分析、业务决策与...

    如果不了解字段的实际业务含义,数据分析人员可能会出现数据类型判断失误。比如字段的取值为“1”“2”“3”等,并不意味着是一个数值类型,它的业务含义还可以是一个分类型的字段,“1”“2”“3”分别代表了一个...
    文章 2019-11-05 1299浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    回答了应用智能运维是什么、为什么、有什么价值、能干什么的问题。为了指导企业实践、落地&xff0c;本章围绕应用场景&xff0c;从技术角度总结归纳了相比于传统的监控运维技术&xff0c;应用智能运维系统特有的几个关键技术...
    文章 2021-07-06 428浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com