Alluxio AI 助力知乎千卡模型训练
在线机房的重点在于实时性和响应速度,以确保用户能够在最短的时间内获得稳定、高效的服务体验。知乎主站作为一个知识社区,其在线机房是为了保障用户对知识和信息的交流与分享能够得到优质、连续的支持。GPU机房:此机房专门用于部署机器学习平台,主要服务于算法用户。其主要特点是提供强大的GPU资源管理、模型训练、数...
「知乎」是如何在超大规模 TiDB 集群上玩转多云多活的?
实现了任何一个在线机房宕机的时候,整个集群是可用的。最近这一段时间,包括一些大的云厂商,和一些很知名的APP,都出现过不可用的故障情况。后面在讲到数据库发展的时候,也会讲到多云多活是未来必须要去解决和发展的方向。2数据库的稳定性建设然后再讲一下我们做的数据库稳定性建设,具体而言也就是TiDB的稳...
抛开噱头与调侃,认真谈运维的职业发展和自我修养(附思维导图)
但一般的非专职运维开发的程序员做出来的系统对于运维来说往往不太好使,这时候有部分年轻的运维工程师升级了研发技能,转型运维开发,把好使的运维系统做出来了,赢得了运维团队的好评,大家都为「运维开发」点赞。所以,大家将「好使的运维系统」和「运维开发」等价起来,以为我们只要招来一个运维开发,那么一套完美...
多云缓存在知乎的探索:从 UnionStore到Alluxio
一般而言,服务的吞吐都不会特别高,还远远达不到专线带宽的流量上限,甚至连专线带宽的一半都达不到,但是在我们的算法场景中有一些比较特殊的情况:算法模型的训练在离线机房,依赖HDFS上的海量数据集,以及Spark集群和机器学习平台进行大规模分布式训练,训练的模型结果存储在HDFS上,一个模型甚至能达到数十上百GB...
论运维职业发展中的自我修养
然而本人上知乎以休闲娱乐为主,一般不回答正儿八经的技术或者专业相关的问题,但希望这次能通过本文向各位题主描述清楚到底运维是干什么的,至于其有没前途、有没发展以及会不会失业等请读者自行判断。「运维是干什么的?」这「运维」二字可能有几层意思,分别可以指代运维工程师、运维团队或者是整个运维服务体系。
一周AIGC 丨国内掀起大模型军备竞赛,第一季度推出超 150个AI 聊天...
4月15日消息,据《科创板日报》报道,北京面壁智能科技有限责任公司(面壁智能)近日完成由知乎领投的数千万元天使轮融资,种子轮股东智谱AI继续跟投(www.e993.com)2024年12月19日。此前公司得到了北京智源人工智能研究院(科技部和北京市支持下创立的人工智能领域的新型研发机构)的孵化支持。
两万字详解自动驾驶开发工具链的现状与趋势
首先,更加复杂的自动驾驶功能,其软件的代码量和功能的复杂程度也提升了几个数量级。结构化的工具箱和块组建模,在开发简单的功能算法时还可以胜任,但在面对复杂的深度学习算法时,MBD在灵活度方面,就显得有些捉襟见肘了。其次,人工智能行业发展这么多年,无论是架构还是工具链、各种各样开源的函数库,都已经形成强大...
是谁在幕后搭建2022北京冬奥会?
对冬奥会技术团队来说,设备测试虽是常态,但都不是小事。他们到了场馆的技术机房后得知,问题出在两台机器连不上网络。为顺利完成检修工作,技术运维人员徒步走上雪如意的陡坡。工程师们决定到高100多米的“雪如意”顶上去摸查清楚,但这天不巧,平时乘搭的缆车停运了,李弘鹏等人只能在零下10摄氏度的寒风中徒步爬上...
给机器人装上蝗虫耳朵,以色列科学家实现生物传感器新突破!
什么是碳中和?它是一种新型绿色发展理念。我们知道,全球气候变暖与二氧化碳排放过度密切有关。为了抑制全球变暖趋势,人类需要尽快实现大气中二氧化碳浓度的零增加。换句话说,人类排放多少二氧化碳,需要有相应的措施吸收多少二氧化碳,即达到“碳中和”。其官方定义是:碳中和是指企业、团体或个人测算在一定时间内直接或间接...
闲置带宽新玩法小融盒子靠谱吗?8年电信老员工自述
这个模式的发展空间其实很大,最早试水的大厂其实很多。优酷、360、百度这些都是靠谱的大公司,但是CDN项目照样坑了。当然也有确实帮助用户赚到钱的项目,比如迅雷赚钱宝当时真是一机难求,今年出来的小融盒子确实能持续赚钱、帮助用户很快回本。那么,怎么在投资的时候辨别,什么项目值得长期投资?什么项目能稳定发展呢?