皮皮网
皮皮网

【如何查看微信授权网页源码】【培训 网站源码】【apm osd源码】知乎网站源码_知乎网站源码是什么

时间:2025-01-07 22:23:46 来源:大气网址导航 源码

1.PyTorch源码学习系列 - 2. Tensor
2.你知道知乎上面挣钱的知乎知乎工作是真还是假吗?
3.知乎vscode插件修改和重新编译
4.如何用JAVA写一个知乎爬虫

知乎网站源码_知乎网站源码是什么

PyTorch源码学习系列 - 2. Tensor

       本系列文章同步发布于微信公众号小飞怪兽屋及知乎专栏PyTorch源码学习-知乎(zhihu.com),欢迎关注。网站网站

       若问初学者接触PyTorch应从何学起,源码源码答案非神经网络(NN)或自动求导系统(Autograd)莫属,知乎知乎而是网站网站看似平凡却无所不在的张量(Tensor)。正如编程初学者在控制台输出“Hello World”一样,源码源码如何查看微信授权网页源码Tensor是知乎知乎PyTorch的“Hello World”,每个初学者接触PyTorch时,网站网站都通过torch.tensor函数创建自己的源码源码Tensor。

       编写上述代码时,知乎知乎我们已步入PyTorch的网站网站宏观世界,利用其函数创建Tensor对象。源码源码然而,知乎知乎Tensor是网站网站如何创建、存储、源码源码设计的?今天,让我们深入探究Tensor的微观世界。

       Tensor是培训 网站源码什么?从数学角度看,Tensor本质上是多维向量。在数学里,数称为标量,一维数据称为向量,二维数据称为矩阵,三维及以上数据统称为张量。维度是衡量事物的方式,例如时间是一种维度,销售额相对于时间的关系可视为一维Tensor。Tensor用于表示多维数据,在不同场景下具有不同的物理含义。

       如何存储Tensor?在计算机中,程序代码、数据和生成数据都需要加载到内存。存储Tensor的物理媒介是内存(GPU上是显存),内存是一块可供寻址的存储单元。设计Tensor存储方案时,apm osd源码需要先了解其特性,如数组。创建数组时,会向内存申请一块指定大小的连续存储空间,这正是PyTorch中Strided Tensor的存储方式。

       PyTorch引入了步伐(Stride)的概念,表示逻辑索引的相对距离。例如,一个二维矩阵的Stride是一个大小为2的一维向量。Stride用于快速计算元素的物理地址,类似于C/C++中的多级指针寻址方式。Tensor支持Python切片操作,因此PyTorch引入视图概念,使所有Tensor视图共享同一内存空间,提高程序运行效率并减少内存空间浪费。

       PyTorch将Tensor的物理存储抽象成一个Storage类,与逻辑表示类Tensor解耦,g t源码建立Tensor视图和物理存储Storage之间多对一的联系。Storage是声明类,具体实现在实现类StorageImpl中。StorageImp有两个核心成员:Storage和StorageImpl。

       PyTorch的Tensor不仅用Storage类管理物理存储,还在Tensor中定义了很多相关元信息,如size、stride和dtype,这些信息都存在TensorImpl类中的sizes_and_strides_和data_type_中。key_set_保存PyTorch对Tensor的layout、device和dtype相关的调度信息。

       PyTorch创建了一个TensorBody.h的模板文件,在该文件中创建了一个继承基类TensorBase的类Tensor。TensorBase基类封装了所有与Tensor存储相关的细节。在类Tensor中,PyTorch使用代码自动生成工具将aten/src/ATen/native/native_functions.yaml中声明的函数替换此处的宏${ tensor_method_declarations}

       Python中的Tensor继承于基类_TensorBase,该类是超级底源码用Python C API绑定的一个C++类。THPVariable_initModule函数除了声明一个_TensorBase Python类之外,还通过torch::autograd::initTorchFunctions(module)函数声明Python Tensor相关的函数。

       torch.Tensor会调用C++的THPVariable_tensor函数,该函数在文件torch/csrc/autograd/python_torch_functions_manual.cpp中。在经过一系列参数检测之后,在函数结束之前调用了torch::utils::tensor_ctor函数。

       torch::utils::tensor_ctor在文件torch/csrc/utils/tensor_new.cpp中,该文件包含了创建Tensor的一些工具函数。在该函数中调用了internal_new_from_data函数创建Tensor。

       recursive_store函数的核心在于

       Tensor创建后,我们需要通过函数或方法对其进行操作。Tensor的方法主要通过torch::autograd::variable_methods和extra_methods两个对象初始化。Tensor的函数则是通过initTorchFunctions初始化,调用gatherTorchFunctions来初始化函数,主要分为两种函数:内置函数和自定义函数。

你知道知乎上面挣钱的工作是真还是假吗?

       在知乎上,有些用户声称通过各种方法轻松赚钱,比如购买域名并利用色情名称吸引用户安装软件以月入过万。然而,这种做法早已过时,且获取源代码本身就几乎不可能。我尝试了知乎上的一位高赞回答者推荐的教程,花费元建立了一个网站,但发现大多数广告联盟没有适合PC的 product,即使有审核也很严格,除非在自己的网站上展示广告,否则不会获得收入。因此,这种方法的月收入是0元。

       另一种常见的建议是写文章,如头条号、百度号等,声称只要会写字就能月入过万。然而,实际情况是,头条号需要至少一个月的时间才能转正并获得收益,而且要写出阅读量超过W+的爆文并不容易。即使写出高阅读量的文章,收入也不一定可观。例如,我曾在百度百家注册并写出了一篇阅读量达W+的文章,但仅获得-元的收入。因此,这种方法的前半年基本没有收入,后半年的收入也取决于运气。

       还有人建议在知乎上写文章,专注于某个领域,成为大V后就有约稿,转发一次就能获得几千的收入。然而,我尝试了这个方法,一年的努力才积累了万粉,而有些人却通过复制粘贴就能迅速获得大量点赞。这些常见的套路在知乎上欺骗粉丝,而真正能赚钱的方法往往不会公开分享。因此,不要轻信别人的轻松赚钱方法,真正赚钱的方法往往写在刑法里。

知乎vscode插件修改和重新编译

       为了在VSCode中安装和使用插件,首先需要确保你的开发环境已安装Node.js。可以考虑将npm的源切换为中国镜像,通过命令行执行npm config set registry https://registry.npm.taobao.org来实现。

       安装插件开发所需的工具,包括webpack和webpack-cli,通过执行命令npm install webpack webpack-cli。接着,将源代码克隆到本地,运行npm install以安装项目依赖。

       为了配置环境变量,新增NODE_PATH,设置为C:\Users\qing\AppData\Roaming\npm\node_modules,并确保该路径被添加到环境变量的Path字段中。

       进行插件的修改时,可以自行调整TypeScript代码。调试过程中,可以通过获取当前打开文件的完整路径并填充到输入框作为默认值。在CONTRIBUTING.md文档中提到,在编译时需要注释掉/node_modules/uglify-js/tools/node.js:中的一部分代码,以避免编译失败。

       为了实现自动编译,执行npm run develop命令,这会在dist目录下生成编译后的文件。在VSCode的调试面板中,选择"Debug - Launch Extension",启动新的VSCode窗口并安装你开发的插件。

       完成代码调试后,需生成插件安装包以方便使用或分发。安装vsce命令行工具通过npm i vsce -g。在项目根目录使用vsce package命令生成.vsix文件,该文件可用于VSCode扩展市场的发布或个人使用。

       安装.vsix文件,只需在VSCode扩展窗口中选择"从vsix安装"并选择对应的文件即可。若需修改插件信息,只需在package.json文件中进行相应的修改。

       在开发过程中遇到问题,可以通过查阅微软VSCode插件开发官方文档、生成vsix文档的说明文档,以及VSCode插件开发全攻略(十)来寻求解决方案。这将提供详细的步骤和最佳实践,帮助解决开发过程中遇到的挑战。

如何用JAVA写一个知乎爬虫

       ä¸‹é¢è¯´æ˜ŽçŸ¥ä¹Žçˆ¬è™«çš„源码和涉及主要技术点:

       ï¼ˆ1)程序package组织

       ï¼ˆ2)模拟登录(爬虫主要技术点1)

        要爬去需要登录的网站数据,模拟登录是必要可少的一步,而且往往是难点。知乎爬虫的模拟登录可以做一个很好的案例。要实现一个网站的模拟登录,需要两大步骤是:(1)对登录的请求过程进行分析,找到登录的关键请求和步骤,分析工具可以有IE自带(快捷键F)、Fiddler、HttpWatcher;(2)编写代码模拟登录的过程。

       ï¼ˆ3)网页下载(爬虫主要技术点2)

        模拟登录后,便可下载目标网页html了。知乎爬虫基于HttpClient写了一个网络连接线程池,并且封装了常用的get和post两种网页下载的方法。

       ï¼ˆ4)自动获取网页编码(爬虫主要技术点3)

        自动获取网页编码是确保下载网页html不出现乱码的前提。知乎爬虫中提供方法可以解决绝大部分乱码下载网页乱码问题。

       ï¼ˆ5)网页解析和提取(爬虫主要技术点4)

        使用Java写爬虫,常见的网页解析和提取方法有两种:利用开源Jar包Jsoup和正则。一般来说,Jsoup就可以解决问题,极少出现Jsoup不能解析和提取的情况。Jsoup强大功能,使得解析和提取异常简单。知乎爬虫采用的就是Jsoup。

       ï¼ˆ6)正则匹配与提取(爬虫主要技术点5)

        虽然知乎爬虫采用Jsoup来进行网页解析,但是仍然封装了正则匹配与提取数据的方法,因为正则还可以做其他的事情,如在知乎爬虫中使用正则来进行url地址的过滤和判断。

       ï¼ˆ7)数据去重(爬虫主要技术点6)

        对于爬虫,根据场景不同,可以有不同的去重方案。(1)少量数据,比如几万或者十几万条的情况,使用Map或Set便可;(2)中量数据,比如几百万或者上千万,使用BloomFilter(著名的布隆过滤器)可以解决;(3)大量数据,上亿或者几十亿,Redis可以解决。知乎爬虫给出了BloomFilter的实现,但是采用的Redis进行去重。

       ï¼ˆ8)设计模式等Java高级编程实践

        除了以上爬虫主要的技术点之外,知乎爬虫的实现还涉及多种设计模式,主要有链模式、单例模式、组合模式等,同时还使用了Java反射。除了学习爬虫技术,这对学习设计模式和Java反射机制也是一个不错的案例。

       4. 一些抓取结果展示

更多内容请点击【热点】专栏