保存成功
订阅成功
保存失败,请重试
提交成功
村中少年

村中少年

网络协议工程师
网络协议工程师,计科本硕,热爱技术,CSDN博客专家。...更多
创作文章9

996ICU 编年史,程序员的狂欢,程序员之殇

2019 年 Github 最火项目非 996.ICU 莫属,既然能够获取 2019 年 GitHub 所有的活动数据,在 1024 程序员节之际,作为一名程序员,准备用程序员的方法还原当年这一盛况,免费分享给大家,如下: - 996.ICU 是由谁在什么时候创建的 - 996.ICU 日均 star 增长曲线,fork 增长曲线,push 增长曲线 - 996.ICU issue title ,issue comment 都讨论了哪些内容 - 996.ICU issue、push 等人员的国籍,公司,城市分布 - 996.ICU 哪个 issue 的评论最多, TOP issue 排名是哪些 - 哪些大佬对于 996.ICU 做出了贡献 - 996.ICU 贡献者在提交 commit 的时候都使用了哪些黑话 如果你还想了解更多内容,请在我的读者圈留言
免费程序员
62 订阅

原来你是这样的 GitHub

GitHub 是全球最大的程序员聚集地,你一定对程序员的社交感兴趣。你以为本文介绍的是爬虫 No No No。授人以鱼不如授人以渔,本文将介绍获取GitHub全量数据的四种方法,通过这些方法对于Github做整体的分析,如下: - GitHub 中哪种语言以及 License 的项目最多 - 你的母校在 GitHub 贡献排名 - 中国在 GitHub 贡献排名 - 哪些公司的开源贡献最多,你的公司排名如何 - 程序员背后的黑话都有哪些 -996.ICU上的issue都有哪些讨论 - 伊朗开发者如何被 GitHub 移除 - GitHub 上有多少独立仓、多少独立提交、多少独立开发者 - 哪些大神在 GitHub上的贡献最多 - 哪些项目被 Fork 的次数最多 在学习完本文方法之后你也可以像一些公众号那样定期发布 GitHub 的一些趋势走向了以及关于 GitHub 的各种挖掘。
295 订阅

关于字符串和编码,你可能还需要了解这些

作为一个程序员,你一定被编码问题折磨过。有的时候好像搞明白了,但是在遇到新问题的时候又会感到困惑。可以说字符集和字符集的编码在计算机中无处不在,本文从键盘输入文字,编辑器显示和存储文本,到具体一个编程语言处理字符等方面聊一聊字符串和编码方面的知识。做一次较为系统的梳理,通过本文你会了解如下内容: 1. 如何不使用输入法输入汉字 2. 字符集和字符编码简介 3. 关于显示和存储 4. python中的字符和编码 5. 文件系统,协议,网页编码方式漫谈
字符编码
140 订阅

基于机器学习实现加密报文中信息的提取

数据加密保证了数据传输过程中的隐私性,意味着无法像明文传输情况下直接提取数据的内容,进行相关的分析工作,很多数据分析厂商面临着挑战。如何在数据加密的情况下,获取传输数据内容相关的有效信息,将是未来一段时间研究方向。 本场 Chat 将以 Youtube 视频传输报文为例,结合机器学习的方法,讲述如如何获取视频的分辨率。为基于加密数据的分析研究提供可借鉴的思路,本文也是机器学习在通信数据分析领域一次有效的实践。 本 Chat 您将了解如下内容: - 视频传输规律的分析方法; - 如何建立视频传输规律和报文数据的映射; - 机器学习方法应用于加密数据分析若干思路。
机器学习
107 订阅

IP 地址中蕴含哪些有用信息

经常有人问我通过 IP 地址能够定位找到人吗,即获取相关的经纬度信息。我的回答是有的时候可以有的时候不行,这要看通信对端的 IP 地址是何种类型。 本次 Chat 就以这个问题为切入点聊一聊 IP 地址的那些事。主要包含如下内容: 1. 保留 IP 和非保留 IP 的概念。 2. 非保留 IP 地址中蕴含哪些信息,包括经纬度,AS number 等信息? 3. 通过编程获取经纬度以及 AS number 这些信息?
IP
215 订阅

当成人网站遇上机器学习

成人网站在国内属于灰色地带,即使在国外的一些合法的国家对于未成年人群也需要限制访问。因此无论国内外对于此类信息的识别特别重要。 成人网站包含大量的色情信息,目前对于色情信息的研究分为多个方面。有基于图像识别,来判定色情图片,色情视频等,主要应用场景是一些聊天软件中。有基于域名等关键信息过滤的来限制对此类站点的访问,主要应用场景是网络出口处,例如教育网和企业出口。本场 Chat 所阐述的是基于文本分类的方法来识别成人网站,例如有的浏览器会提示你访问的网站包含色情信息,就会用到类似的方法。 本场 Chat 主要包括以下几个方面: 1. 分析网站哪些信息可以作为识别的语料信息; 2. 语料信息的获取; 3. 分词,去停用词形成词向量特征; 4. 模型的训练识别及分析; 5. 基于本文所述方法的扩展应用。
机器学习
196 订阅

访问一个网址会经历哪些流程

如今互联网的繁荣,离不开网络协议的支持。了解网络协议如何协同工作完成数据的传输是解决很多问题的前提。 本场 Chat 以访问一个实际的HTTP网站为例,结合具体抓取的数据报文讲述访问一个网址背后的经历了哪些协议过程,包括 HTTP,TCP,DNS,UDP,IP,ARP 等协议。通过自顶向下以及自底向上的分析呈现出各层协议是如何协同工作,完成网页数据的传输。 通过本 Chat 你将学到如下内容: 1. HTTP,TCP, DNS ,ARP 等协议原理概述。 2. 站在各个协议层次来分析协议间是如何对等传输的。 3. 站在数据发送者的角度自顶向下的分析,分析各层协议字段如何获取。 4. 站在数据接受者的角度自底向上的分析,分析层协议之间的联系。
严选访问
499 订阅

PCAP 报文中图片视频的自动化还原方法

PCAP 报文就是抓取实际在网络中传输的图片,视频等数据,然后以 PCAP 格式存储形成的文件。有的时候会遇到将 PCAP 中的码流还原成相应的图片,视频等原有格式的需求。例如运营商可能需要将一些监控的数据进行还原,来判定用户行为是否违法等。本场 Chat 内容就抛砖引玉,以几个场景为例来讲解一下如何借助 Wireshark 自动化的完成相关文件的还原。 1. 使用 Wireshark Lua 插件还原SSL报文中的数字证书。 2. 使用 Wireshark Lua 插件还原HTTP报文中的图片。 3. 使用 Wireshark Lua 插件还原优酷网报文中的视频。
PCAP自动化还原
112 订阅

如何利用 Wireshark 对 PCAP 报文实施批量增删改查

工作中会经常遇到批量分析提取报文特征,批量修改报文的需求。这个时候就需要用到 Wireshark 所提供的一些自动化方法,在 Wireshark 基础上进行二次开发等。使用基于 Wireshark 方法的好处在于 Wireshark 支持的协议在2000+,涵盖了市面上绝大部分协议,同时 Wireshark 提供了大量的过滤器,能够满足任意字段的提取,优势极其明显。 本次 Chat 跟大家分享一下报文批量处理所用到的一些技术,包括 Tshark 以及 Lua 插件的开发技术。 本场 Chat 的主要包括如下内容: 1. 基于 Tshark 的单个数据包粒度的报文批处理方法; 2. 基于 Wireshark Lua 插件的单片报文粒度的报文批量处理方法; 3. 基于 Wireshark Lua 插件的报文批量增删改查。
Wireshark
115 订阅
微信扫描登录