我们要做一个高性能的系统,要具备一个低延迟、高实时性,微博要做到高实时性这是核心的价值,实时性的核心就是让数据离CPU最近,避免磁盘的 IO。我们看淘宝核心系统专家余锋说过的一句话“CPU访问L1就像从书桌拿一本书,L2是从书架拿一本书,L3是从客厅桌子上拿一本书,访问主存就像骑车去社区图书馆拿一书”。我们微博如果要做到非常实时的话,我们就需要把数据尽量离CPU节点最近。所以我们看一下cache设
转载
2023-09-30 21:52:36
109阅读
相信大家都有微博了,作为一个技术人员,往往关注的不是明星,而是技术。微博现在很火,底层技术是如何实现的呢,最近 在网上看到一篇文章,是关于微博底层技术的架构,和大家分享一下。 很多技术人员对微博的构架非常感兴趣,就是一个明星他有300万粉丝,这个技术怎么来实现?今天在这里跟大家分享一下微博的底层机构,让大家对微博的底层技术有更
转载
2023-07-14 19:27:16
108阅读
本文主要记录分析新浪微博登陆以及发送文字和图片微博的详细过程
原文链接(本人):说明本文主要记录分析新浪微博登陆以及发送文字和图片微博的详细过程分析登陆入口选择的是新浪通行证登陆入口
https://login.sina.com.cn/signup/signin.php
抓包找到登陆请求
https://login.sina.com.cn/sso/log
转载
2023-08-18 15:50:30
255阅读
新浪微博头条文章在去年12月底正式上线,使用头条文章可以让长文在信息流中以更醒目的方式呈现,编辑效果和打开速度也将提升,从而优化用户的阅读体验。 新浪微博头条文章发布方法: 1、登录新浪微博,打开首页; 2、点击【头条文章】; 3、打开每天有不计其数的博主会在微博上发表头条文章,那么微博网页版怎么发布头条文章?今天的视频就来为大家解答一下,一起来看看吧。1、新浪微博头条文章发布后需要通过新浪收藏进
转载
2023-06-27 23:25:27
173阅读
http://book.51cto.com/art/201310/412836.htm短短几年时间新浪微博的用户数就从零增长到数亿,明星用户的粉丝数达数千万,围绕着新浪微博正在发展一个集社交、媒体、游戏、电商等多位一体的生态系统。同大多数网站一样,新浪微博也是从一个小网站发展起来的。简单的LAMP(Linux+Apache+MySQL+PHP)架构,支撑起最初的新浪微博,应用程序用PHP开发,所有
转载
2023-09-26 20:05:13
336阅读
新浪微博事业部总结了三种微博格式,一个是阿迪达斯的蒲公英式,适合于拥有多个子品牌的集团;另一个是放射式,由一个核心账号统领各分属账号,分属账号之间是平等的关系,信息由核心账号放射向分属账号,分属账号之间信息并不进行交互,这种适合地方分公司比较多并且为当地服务的业务模式。第三个是双子星模式,老板一个账号很有影响力,公司官方一个账号也有影响力,形成互动。这些都是比较初级的模式,企业真正要建立的体系,除
转载
2023-08-21 19:39:44
809阅读
此类RESTful接口的开放平台,一般而言都采用OAuth认证方式针对新浪微博新版接口举例如下:1、获取codehttps://api.weibo.com/oauth2/authorize?client_id=YOUR_CLIENT_ID&response_type=code&redirect_uri=YOUR_REGISTERED_REDIRECT_URI在创建应用时需要填写YO
转载
2023-07-09 14:32:36
92阅读
1 import requests
2 from urllib.parse import urlencode
3 from pyquery import PyQuery as pq
4 from pymongo import MongoClient
5
6 base_url = 'https://m.weibo.cn/api/container/getIndex?'
7 header
转载
2023-05-23 21:51:52
184阅读
背景:实验室大数据分析需要得到社交网站的数据,首选当然是新浪。数据包括指定关键词、话题、位置的微博的内容。字段包括:图片、时间、用户、位置信息。思路分析:要爬新浪的数据主要有2种方法: 1.微博开发者平台提供的微博API,资源包括微博内容、评论、用户、关系、话题等信息。同时,你也可以申请高级接口、商业接口获得更多权限,你要去注册申请成为开发者获得OAuth2授权以及这个使
转载
2023-07-06 11:26:20
136阅读
这里的微博爬虫,我主要实现的是输入你关心的某个大 V 的微博名称,以及某条微博的相关内容片段,即可自动爬取相关该大 V 一段时间内发布的微博信息和对应微博的评论信息。Cookie 获取与上面的 Boss 直聘网站类似,爬取微博也需要获取响应的 cookie。 用浏览器打开微博页面,拷贝出对应的 Cookie,保存到本地。微博搜索既然是某位大 V,这里就肯定涉及到了搜索的事情,我们可以先来尝试下微博
转载
2023-06-14 15:19:59
138阅读
接下来教大家如何将新浪微博的内容同步更
原创
2022-09-28 21:31:40
210阅读
上一篇博文总详细讲解了微博客户端开发的基本的过程,在此对整个微博客户端开发流程进行一个总结。首先: 开发者需要在新浪开放平台注册为开发者,可以注册为个人开发者或者企业开发者。(当然企业开发者是一帮很牛的人了,并且企业开发者开发的应用上线也会比较快,我是亲身体会的呀。)开发者身份认证成功之后,登录开发者管理中心,创建应用,获取到app_key,app_secret值,需要填写应用的相应的信息,比如
转载
2023-08-29 12:51:05
77阅读
@数据化管理:其实和日期有关的函数都应该是HR必备的,比如:date、year、month、day、day360......这些函数组合可以自动提醒续约日、生日提醒等。 // @环球人力资源智库:【HR必会EXCEL技巧】对于HR新人,尤其是做薪酬、绩效及档案管理工作的HR,有两个基础的EXCEL技巧你是一定要学会的,会大大提高你工作效率。第一个就是数据透视表(教程见http://t.cn/zOL
原创
2022-08-20 00:59:24
171阅读
一 分享有三种方式:1 直接调用Sina微博的api2 调用Sina提供的jar包3 调用第三方提供的jar包二:授权过程如图
原创
2013-11-26 17:59:16
556阅读
一、云平台中云是指互联网,网络的一种比喻说法,顾名思义,这种平台允许开发者们或是将写好的程序放在“云”里运行,或是使用“云”里提供的服务,或二者皆是。 二、开发类云平台比较: 1、鼻祖 GOOGLE APP ENGINE 2、Sina app engine 3、阿里云 ...
转载
2014-10-03 17:59:00
218阅读
2评论
快速找代码appDelegate.window.rootViewController = tabBarControllertabBarController操作 rootViewController/addChildView:navigationController操作 prepareForPush
转载
2016-04-24 17:58:00
175阅读
2评论
一、起因最近几天陈情令大火,而#肖战#王一博等人也成为众人所熟知的对象,所以我想用Scrapy爬取演员的微博信息来分析下演员信息二、 目标本次爬取的的公开基本信息,如用户昵称、头像、用户的关注、粉丝列表以及发布的微博等,这些信息抓取之后保存至Mysql,并绘制出图表三、准备工作请确保代理池、Cookies池已经实现并可以正常运行,安装Scrapy、PyMysql库。这里我新注册了四个微博
转载
2023-09-10 22:22:06
0阅读
新浪微博第三代技术体系:水平方向:接口层 服务层 资源层垂直方向:业务架构 技术架构 监控平台 服务治理平台水平维度的划分,在大中型互联网后台业务系统的设计中非常基础,在平台的每一代技术体系中都有体现。这里
转载
2023-07-17 16:28:08
255阅读
NoSQL优秀公司的最佳实践
1. 新浪微博 - Redis新浪微博从技术上来说,每天用户发表微博特别容易,这造成每天新增的数据量都是百万级、上千万级的这样一个量。经常要面对的一个问题就是增加服务器,因为一般一台MySQL服务器,它可能支撑的规模也就是几千万,或者说复杂一点只有几百万,这样,可能每天都要增加服务器,从而解决所你面对的这些问题。目前新浪微博是Redis全球最大的用户,在
转载
2023-08-01 11:26:32
183阅读
首先看下新浪微博客户端界面如图: 每转发一次都会增加一个@xxx,而点击@xxx则进入该用户详细资料界面,点击分内容其实可以是一个字