CN114595191B - 网页处理方法、装置、电子设备及存储介质 - Google Patents
网页处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114595191B CN114595191B CN202210225086.2A CN202210225086A CN114595191B CN 114595191 B CN114595191 B CN 114595191B CN 202210225086 A CN202210225086 A CN 202210225086A CN 114595191 B CN114595191 B CN 114595191B
- Authority
- CN
- China
- Prior art keywords
- document
- picture
- cell
- information
- web page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/176—Support for shared access to files; File sharing support
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/101—Collaborative creation, e.g. joint development of products or services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供了一种网页处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品;可以应用于车载场景,方法包括:在人机交互界面中显示网页;响应于针对所述网页的表格转换触发操作,显示对所述网页进行表格转换后得到的表格文档;其中,所述网页包括的至少一个信息对应填充在所述表格文档的至少一个单元格中;响应于针对所述表格文档的分享触发操作,以分享对象的身份向至少一个被分享对象发送在线文档形式的所述表格文档;其中,所述在线文档用于供所述分享对象和所述至少一个被分享对象进行协同编辑。通过本申请,能够将网页转换为可供多人在线协同编辑的表格文档,提高了文档的编辑效率。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种网页处理方法、装置、电子设备及计算机可读存储介质。
背景技术
在用户的日常学习以及工作中,可以通过浏览网页的方式来获取所需要的信息,针对比较重要的网页,用户还可以将该网页存储到本地。
相关技术中,通常只能将网页转换为长图、离线网页、或者PDF等文档进行存储,然而,上述格式的文档支持的编辑功能比较有限,无法满足用户的编辑需求。
发明内容
本申请实施例提供一种网页处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够将网页转换为可供多人在线协同编辑的表格文档,提高了文档的编辑效率。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种网页处理方法,包括:
在人机交互界面中显示网页;
响应于针对所述网页的表格转换触发操作,显示对所述网页进行表格转换后得到的表格文档;其中,所述网页包括的至少一个信息对应填充在所述表格文档的至少一个单元格中;
响应于针对所述表格文档的分享触发操作,以分享对象的身份向至少一个被分享对象发送在线文档形式的所述表格文档;其中,所述在线文档用于供所述分享对象和所述至少一个被分享对象进行协同编辑。
本申请实施例提供一种网页处理装置,包括:
显示模块,用于在人机交互界面中显示网页;
所述显示模块,还用于响应于针对所述网页的表格转换触发操作,显示对所述网页进行表格转换后得到的表格文档;其中,所述网页包括的至少一个信息对应填充在所述表格文档的至少一个单元格中;
发送模块,用于响应于针对所述表格文档的分享触发操作,以分享对象的身份向至少一个被分享对象发送在线文档形式的所述表格文档;其中,所述在线文档用于供所述分享对象和所述至少一个被分享对象进行协同编辑。
本申请实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的网页处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本申请实施例提供的网页处理方法。
本申请实施例提供一种计算机程序产品,包括计算机程序或指令,用于被处理器执行时,实现本申请实施例提供的网页处理方法。
本申请实施例具有以下有益效果:
通过对网页进行表格转换处理,得到对应的表格文档,接着以在线文档的形式将得到的表格文档发送给至少一个被分享对象,能够实现多人在线协同编辑表格文档,实现了从网页到表格文档的在线协同编辑,提高了文档的编辑效率,同时也满足了用户对文档的快速生成、以及多样化的编辑需求。
附图说明
图1是本申请实施例提供的网页处理系统100的架构示意图;
图2是本申请实施例提供的终端设备400的结构示意图;
图3是本申请实施例提供的网页处理方法的流程示意图;
图4A是本申请实施例提供的从网页中获取至少一个信息的原理示意图;
图4B和图4C是本申请实施例提供的网页处理方法的流程示意图;
图5A和图5B是本申请实施例提供的网页处理方法的应用场景示意图;
图6A至图6E是本申请实施例提供的网页处理方法的应用场景示意图;
图7是本申请实施例提供的网页处理方法的流程示意图;
图8是本申请实施例提供的从网页转换得到的表格文档的示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
可以理解的是,在本申请实施例中,涉及到用户的历史发送记录等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
在以下的描述中,所涉及的术语“第一\第二\…”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\…”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
在以下的描述中,所涉及的术语“多个”是指至少两个。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)响应于:用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
2)网页:构成网站的基本元素,是承载各种网站应用的平台。具体来说,网页是一个包括超文本标记语言(HTML,Hyper Text Markup Language)标签的纯文本文件,它可以存放在世界某个角落的某一台计算机中,是超文本标记语言格式,网页的扩展名为.html或者.htm。网页通常用图像档来提供图画,网页要通过网页浏览器来阅读。
3)在线文档:一种供用户在线编辑、多用户协作并实时保存于云端的文档,通过HTML页面进行文档显示,依赖于客户端与服务器的通信实现对用户编辑内容的同步,在线文档的类型可以是在线Word文档、在线Excel文档、在线PPT文档、在线制图文档。
4)插件(Plug-in):是一种遵循一定规范的应用程序接口编写出来的程序,其只能运行在程序规定的系统平台下(可能同时支持多个平台),而不能脱离指定的平台单独运行。例如在浏览器中,安装相关的插件后,浏览器可以直接调用插件程序,用于处理特定类型的文件,从而扩展了浏览器的功能。
5)事件:同一类型的信息组成的集合,例如以网页为酒店的搜索结果页为例,假设搜索结果页中包括多个酒店的搜索结果,则可以将每个酒店的搜索结果确定为一个事件,例如可以将酒店A的搜索结果确定为事件1,将酒店B的搜索结果确定为事件2,将酒店C的搜索结果确定为事件3。
6)单元:组成事件的基本元素,例如以事件为酒店A的搜索结果为例,则该事件可以由以下单元组成:酒店A的名称信息(假设为单元1)、酒店A的地址信息(假设为单元2)、酒店A的价格信息(假设为单元3)、酒店A的配图(假设为单元4)等。
7)网页标签:即HTML标签,是HTML语言中最基本的单位,HTML标签是HTML最重要的组成部分。网页标签的类型可以包括文本标签和图片标签,其中,文本标签指定了网页中对应显示的一个文本信息,图片标签指定了网页中对应显示的一个图片信息,且图片标签指定的是图片在网络中的地址,在基于图片标签获取对应的图片信息时,首先需要根据图片标签指定的地址从网络中下载相应的图片。
8)小程序(Mini Program):是一种不需要下载安装即可使用的应用程序。为了向用户提供更多样化的业务服务,开发者可为终端设备的应用(例如即时通信应用、购物应用、邮件应用等)开发相应的小程序,该小程序可作为子应用被嵌入至终端设备的应用中,通过运行应用内的子应用(即对应的小程序)能够为用户提供相应的业务服务。
本申请实施例提供一种网页处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够将网页转换为可供多人在线协同编辑的表格文档,提高了文档的编辑效率。下面说明本申请实施例提供的电子设备的示例性应用,本申请实施例提供的电子设备可以实施为各种类型的终端设备,也可以由服务器和终端设备协同实施。
下面以由服务器和终端设备协同实施本申请实施例提供的网页处理方法进行说明。示例的,参见图1,图1是本申请实施例提供的网页处理系统100的架构示意图,为实现支撑一个能够将网页转换为可供多人在线协同编辑的表格文档,以满足用户对文档的快速生成、以及便携编辑需求的应用,如图1所示,网页处理系统100包括:服务器200、网络300和终端设备400,其中,网络300可以是广域网或者局域网,又或者是二者的组合。
在一些实施例中,终端设备400上运行有客户端410,客户端410可以是各种类型的客户端,例如浏览器、即时通信客户端等,在客户端410的人机交互界面中显示有网页(例如酒店的搜索结果页、电商网页、以及热门排行榜等);当客户端410接收到针对网页的表格转换触发操作时,可以将在人机交互界面中显示的网页通过网络300发送至服务器200,以使服务器200对网页进行分析,并将网页包括的至少一个信息对应填充在空表格文档中,得到与网页对应的表格文档。接着,当客户端410接收到服务器200返回的表格文档之后,可以在人机交互界面中显示对网页进行表格转换后得到的表格文档。在得到表格文档之后,客户端410还可以响应于针对表格文档的分享触发操作,以分享对象的身份向至少一个被分享对象发送在线文档形式的表格文档,例如客户端410在接收到分享对象(例如用户A)触发的分享触发操作之后,可以通过网络300向服务器200发送分享请求,分享请求中携带有被分享对象(例如用户B)的账号。服务器200在接收到终端设备400发送的分享请求之后,可以从分享请求中解析出被分享对象的账号(即用户B的账号),并向与被分享对象的账号关联的终端设备(即用户B的终端设备,图1中未示出)发送在线文档形式的表格文档(例如服务器可以向用户B的终端设备发送在线文档的地址,以使用户B的终端设备根据该地址来获取在线文档,从而减小传输过程中需要消耗的资源),如此,用户A和用户B可以针对在线文档进行协同编辑,提高了文档的编辑效率,同时也满足了用户针对文档的快速生成、以及多样化编辑的需求。
在另一些实施例中,本申请实施例提供的网页处理方法也可以由终端设备单独实施,例如以图1中示出的终端设备400为例,在终端设备400的人机交互界面中显示网页,当终端设备400接收到针对网页的表格转换触发操作时,对人机交互界面中当前显示的网页进行分析,并将网页包括的至少一个信息对应填充在空表格文档的至少一个单元格中,得到与网页对应的表格文档,接着,终端设备400可以在人机交互界面中显示对网页进行表格转换后得到的表格文档,随后当终端设备400接收到针对表格文档的分享触发操作时,可以以分享对象的身份向至少一个被分享对象发送在线文档形式的表格文档,其中,表格文档用于供分享对象和至少一个被分享对象进行协同编辑,如此,提高了文档的编辑效率,同时也满足了用户对文档的快速生成、以及多样化编辑的需求。
在一些实施例中,终端设备400或服务器200还可以通过运行计算机程序来实现本申请实施例提供的网页处理方法,例如,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序,如即时通信类的应用程序(对应上文的客户端410);也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序,如嵌入至即时通信类的应用程序中的小程序组件,其中,该小程序组件可以由用户控制运行或关闭。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,其中,云服务可以是网页处理服务,供终端设备400进行调用。终端设备400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能电视、智能手表、车载终端等,但并不局限于此。终端设备400以及服务器200可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
下面对图1中示出的终端设备400的结构进行说明。参见图2,图2是本申请实施例提供的终端设备400的结构示意图,图2所示的终端设备400包括:至少一个处理器420、存储器460、至少一个网络接口430和用户接口440。终端设备400中的各个组件通过总线系统450耦合在一起。可理解,总线系统450用于实现这些组件之间的连接通信。总线系统450除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统450。
处理器420可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口440包括使得能够呈现媒体内容的一个或多个输出装置441,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口440还包括一个或多个输入装置442,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器460可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器460可选地包括在物理位置上远离处理器420的一个或多个存储设备。
存储器460包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器460旨在包括任意适合类型的存储器。
在一些实施例中,存储器460能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统461,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块462,用于经由一个或多个(有线或无线)网络接口430到达其他电子设备,示例性的网络接口430包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块463,用于经由一个或多个与用户接口440相关联的输出装置441(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块464,用于对一个或多个来自一个或多个输入装置442之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的网页处理装置可以采用软件方式实现,图2示出了存储在存储器460中的网页处理装置465,其可以是程序和插件等形式的软件,包括以下软件模块:显示模块4651、发送模块4652、识别模块4653、下载模块4654、安装模块4655、移动模块4656、删除模块4657、确定模块4658、转换模块4659、图像识别模块46510、创建模块46511、填充模块46512、解析模块46513和获取模块46514,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。需要指出的是,在图2中为了表述方便,一次性示出了上述所有模块,在实际应用中,不排除网页处理装置465中仅包括显示模块4651和发送模块4652的实施,将在下文中说明各个模块的功能。
下面将结合本申请实施例提供的终端设备的示例性应用和实施,对本申请实施例提供的网页处理方法进行具体说明。
参见图3,图3是本申请实施例提供的网页处理方法的流程示意图,将结合图3示出的步骤进行说明。
在步骤101中,在人机交互界面中显示网页。
在一些实施例中,人机交互界面可以是显示于客户端(例如浏览器、即时通信客户端等)中的,在人机交互界面中显示的网页可以是搜索结果页、电商网页、以及热门排行榜等。
示例的,以客户端为浏览器为例,当浏览器接收到用户在搜索框中输入的关键词后,可以向服务器发送用户输入的关键词,以从服务器中获取与关键词匹配的搜索结果,接着浏览器在接收到服务器返回的搜索结果之后,可以在人机交互界面中显示与关键词匹配的搜索结果页。
在步骤102中,响应于针对网页的表格转换触发操作,显示对网页进行表格转换后得到的表格文档。
这里,网页包括的至少一个信息对应填充在表格文档的至少一个单元格中。
在一些实施例中,可以通过以下方式实现步骤102:在人机交互界面中显示工具箱入口;响应于针对工具箱入口的触发操作,显示工具箱界面,其中,工具箱界面包括表格转换工具;将针对表格转换工具的触发操作,识别为针对网页的表格转换触发操作,并显示对网页进行表格转换后得到的表格文档。
示例的,以客户端为浏览器为例,在浏览器的人机交互界面中可以显示有工具箱入口;当浏览器接收到用户针对工具箱入口的点击操作时,会以弹窗的方式显示工具箱界面,其中,在工具箱界面中可以显示有表格转换工具(当然,在工具箱界面中还可以显示有其他工具,例如图片转换工具、PDF转换工具等);当浏览器接收到用户针对工具箱界面中显示的表格转换工具(例如“Excel”按钮)的点击操作时,会将用户当前浏览的网页转换为表格文档,并在人机交互界面中进行显示。
在另一些实施例中,也可以将针对网页触发的设定的手势操作(例如用户预先设定的三指抓取操作,其中,不同类型的手势操作对应的功能不同),识别为针对网页的表格转换触发操作;当然,也可以将针对运行网页的终端设备的设定的摇动操作(例如上下摇动操作,其中,不同类型的摇动操作对应的功能不同),识别为针对网页的表格转换触发操作,本申请实施例不对表格转换触发操作的类型进行具体限定。
在一些实施例中,人机交互界面可以是显示于客户端中的,其中,表格转换工具是客户端中的原生的功能。
示例的,以客户端为浏览器为例,人机交互界面可以是显示于浏览器中的,其中,表格转换工具是浏览器中的原生的功能(即浏览器自身具备将网页转换为表格文档的功能),如此,用户在使用浏览器浏览网页时,无需下载额外的插件,只需通过浏览器自带的表格转换工具即可将当前浏览的网页转换为对应的表格文档,实现了表格文档的快速生成,进一步提高了用户的操作效率。
在另一些实施例中,人机交互界面可以是显示于客户端中的,其中,表格转换工具可以是客户端中的插件,则在工具箱界面中显示插件之前,还可以执行以下处理:响应于客户端中未安装插件,从服务器中下载插件,并进行插件的安装。
示例的,以客户端为浏览器为例,人机交互界面可以是显示于浏览器中的,其中,表格转换工具可以是浏览器中的插件(即浏览器自身不具备将网页转换为表格文档的功能,需要在浏览器中安装额外的具备将网页转换为表格文档功能的插件来扩展浏览器的功能),则在工具箱界面中显示插件之前,还可以执行以下处理:响应于浏览器中未安装插件(例如用户第一次使用将网页转换为表格文档的功能),自动从服务器中下载插件,并在浏览器中安装所下载的插件,如此,在安装完插件之后,会在工具箱界面中显示所安装的插件。
在一些实施例中,在显示对网页进行表格转换后得到的表格文档之前,还可以执行以下处理:将网页转换为图片;对图片进行图像识别处理,得到图片包括的至少一个信息;创建空表格文档,并将图片包括的至少一个信息对应填充在空表格文档的至少一个单元格中,得到表格文档。
示例的,可以通过以下方式实现上述的对图片进行图像识别处理,得到图片包括的至少一个信息:首先调用第一图像识别模型对图片进行第一图像识别处理,以将图片划分为至少一个事件图片(即图片中与某个事件对应的区域,例如当从网页转换得到的图片中包括多个酒店的搜索结果时,事件图片1可以是图片中酒店A的搜索结果所在的区域,事件图片2可以是图片中酒店B的搜索结果所在的区域,事件图片3可以是图片中酒店C的搜索结果所在的区域);其中,第一图像识别模型是基于样本图片、以及在样本图片中标注出的至少一个样本事件所对应的区域进行训练得到的;接着调用第二图像识别模型对每个事件图片进行第二图像识别处理,以将每个事件图片划分为至少一个单元图片(即事件图片中与某个单元对应的区域,例如以事件图片1为例,单元图片1可以是事件图片1中酒店A的地址所在的区域,单元图片2可以是事件图片1中酒店A的价格所在的区域,单元图片3可以是事件图片1中酒店的评分所在的区域);其中,第二图像识别模型是基于样本事件图片、以及在样本事件图片中标注出的至少一个样本单元所对应的区域进行训练得到的,样本单元是样本事件的元素(例如当样本事件为某个酒店的搜索结果时,样本单元可以是该酒店的地址、名称、配图、评分、以及价格等);最后针对每个单元图片进行光学字符识别处理,得到图片包括的至少一个信息。
需要说明的是,上述的第一图像识别模型和第二图像识别模型可以是神经网络模型(例如卷积神经网络、深度卷积神经网络、或者全连接神经网络等)、决策树模型、梯度提升树、多层感知机、以及支持向量机等,本申请实施例对第一图像识别模型和第二图像识别模型的类型不作具体限定。
在另一些实施例中,承接上文,可以通过以下方式实现上述的针对每个单元图片进行光学字符识别处理,得到图片包括的至少一个信息:针对每个单元图片进行光学字符识别处理,当识别成功时(即能够从单元图片中提取出对应的文本信息),将识别出的文本信息确定为图片包括的一个文本信息;当识别失败时(即无法从单元图片中提取出对应的文本信息),将单元图片确定为图片包括的一个图片信息。
示例的,参见图4A,图4A是本申请实施例提供的从网页中获取至少一个信息的原理示意图,如图4A所示,在将网页(假设为关键词是手机的电商网页)转换为图片之后,可以调用第一图像识别模型对转换得到的图片进行第一图像识别处理,以将图片划分为3个事件图片(即进行第一次图片分类),分别为事件图片1(例如图片中手机A的搜索结果所在的区域)、事件图片2(例如图片中手机B的搜索结果所在的区域)和事件图片3(例如图片中手机C的搜索结果所在的区域),接着,针对划分得到的每个事件图片,还可以调用第二图像识别模型对每个事件图片进行第二图像识别处理,以将每个事件图片进一步划分为至少一个单元图片(即进行第二次图片分类),例如对于事件图片1,可以进一步划分为3个单元图片,分别为单元图片1(例如事件图片1中手机A的配图所在的区域)、单元图片2(例如事件图片1中手机A的配置信息所在的区域)和单元图片3(例如事件图片1中手机A的价格所在的区域);对于事件图片2,可以进一步划分为单元图片4(例如事件图片2中手机B的配图所在的区域)、单元图片5(例如事件图片2中手机B的配置信息所在的区域)和单元图片6(例如事件图片2中手机B的价格所在的区域);对于事件图片3,可以进一步划分为单元图片7(例如事件图片3中手机C的配图所在的区域)、单元图片8(例如事件图片3中手机C的配置信息所在的区域)和单元图片9(例如事件图片3中手机C的价格所在的区域)。在得到多个单元图片之后,还可以针对每个单元图片进行光学字符识别(OCR,Optical Character Recogniton)处理,当识别成功时,可以将识别出的文本信息确定为图片包括的一个文本信息,例如对于单元图片2,在经过OCR字符识别之后,可以提取到如下的文本信息:“XX畅玩7 2GB+16GB金色全通网4G手机双卡双待”,则可以将识别出的文本信息“XX畅玩7 2GB+16GB金色全通网4G手机双卡双待”确定为图片包括的一个文本信息(即可以将识别出的文本信息“XX畅玩7 2GB+16GB金色全通网4G手机双卡双待”填充在表格文档对应的一个单元格中);当识别失败时,可以将单元图片确定为图片包括的一个图片信息,例如对于单元图片1,在经过OCR字符识别之后,无法提取到任何的文本信息,则可以将单元图片1确定为图片包括的至少一个图片信息(即可以将单元图片1直接填充在表格文档对应的一个单元格中)。
在一些实施例中,在得到图片包括的至少一个信息之后,还可以通过以下方式实现上述的将图片包括的至少一个信息对应填充在空表格文档的至少一个单元格中:针对每个事件图片执行以下处理:将事件图片包括的至少一个单元图片分别对应的文本信息或者至少一个单元图片,对应填充在空表格文档同一行或者同一列包括的至少一个单元格中。
示例的,以事件图片为图4A中示出的事件图片1为例,可以将单元图片1、单元图片2对应的文本信息“XX畅玩7 2GB+16GB金色全通网4G手机双卡双待”、以及单元图片3对应的文本信息“599”,对应填充在空表格文档的同一行或者同一列包括的3个单元格中,如此,将针对同一事件的多个信息填充在表格文档的同一行或者同一列中,方便了用户进行查看。
在另一些实施例中,在显示对网页进行表格转换后得到的表格文档之前,还可以执行以下处理:对网页的代码源数据进行解析,得到网页包括的多个网页标签;其中,网页标签的类型包括文本标签(例如<mark>、<pre>等标签,其中,<mark>标签用于定义有记号的文本,即<mark>标签指定了嵌入在网页中的有记号的文本信息;<pre>标签用于定义预格式文本,即<pre>标签指定了嵌入在网页中的符合预格式的文本信息)和图片标签(例如<img>标签,用于定义图片,即<img>标签指定了嵌入在网页中的图片信息),每个文本标签指定了网页中对应显示的一个文本信息,每个图片标签指定了网页中对应显示的一个图片信息;基于多个网页标签中的至少一个目标网页标签,获取至少一个信息(例如以目标网页标签为<img>标签为例,<img>标签指定了在网页中对应显示的一个图片信息(例如图片A)在网络中的地址,例如图片A的统一资源定位符(URL,Uniform Resource Locator),因此可以基于<img>标签指定的图片A的URL,从网络中获取图片A);创建空表格文档,并将所获取的至少一个信息对应填充在空表格文档的至少一个单元格中,得到表格文档。
在一些实施例中,还可以结合上文提及的将网页转换为图片,并对图片进行图像识别处理的方案来获取至少一个信息,例如在接收到针对网页触发的表格转换触发操作之后,可以首先尝试对网页的代码源数据进行解析,当成功对网页的代码源数据进行解析时,可以基于解析出的网页标签来获取至少一个信息;当对网页的代码源数据进行解析失败时,说明网页的代码的版本或类型属于不被支持解析的范畴,可以使用上文提及的将网页转换为图片,并对图片进行图像识别处理的方案来获取至少一个信息,如此,保证针对不同类型或版本的网页语言开发的网页都能顺利进行转换为表格文档。
在一些实施例中,参见图4B,图4B是本申请实施例提供的网页处理方法的流程示意图,如图4B所示,在执行完图3示出的步骤102之后,还可以执行图4B示出的步骤104,将结合图4B示出的步骤104进行说明。
在步骤104中,响应于针对表格文档中第一单元格的拖动操作的当前落点处于第二单元格,将第一单元格中填充的第一信息移动至第二单元格中,且第一信息以覆盖第二单元格的方式显示。
在一些实施例中,表格文档可以是始终处于可编辑状态的,即在响应于针对表格文档中第一单元格的拖动操作的当前落点处于第二单元格之前,无需对表格文档的状态进行切换。
在另一些实施例中,当第二单元格中原先填充有第二信息时,还可以执行以下处理:将第二信息移动到预览区域(例如在表格文档中悬浮显示的预览区域)中进行显示,其中,预览区域还可以显示以下入口至少之一:位移入口、删除入口;响应于针对位移入口的触发操作,将第二信息从预览区域移动至第一单元格中;响应于针对删除入口的触发操作,从预览区域中删除第二信息。
示例的,参见图5A,图5A是本申请实施例提供的网页处理方法的应用场景示意图,如图5A所示,在人机交互界面501中显示有对网页进行表格转换后得到的表格文档502,此时,用户可以针对表格文档502进行编辑,例如当接收到用户针对表格文档502中的单元格503的拖动操作,且该拖动操作的当前落点处于表格文档502中的单元格504时,可以将单元格503中填充的信息505(例如酒店A的配图)移动至单元格504中,且信息505以覆盖单元格504的方式显示。此外,当单元格504中原先填充有信息507(例如酒店C的地址信息)时,还可以将信息507移动至预览区域(例如在表格文档502中悬浮显示的预览区域506)中进行显示,其中,预览区域506中还可以显示有位移入口508和删除入口509;当接收到用户针对位移入口508的点击操作时,可以将信息507从预览区域506移动至单元格503中,同时在表格文档502中取消显示预览区域506;当接收到用户针对删除入口509的点击操作时,可以从预览区域506中删除信息507,并在表格文档502中取消显示预览区域506,如此,满足了用户针对表格文档的便携编辑的需求。
在另一些实施例中,在对网页进行表格转换得到表格文档之后,还可以执行以下处理:响应于针对表格文档中第一单元格的拖动操作的当前落点处于第二单元格,显示操作列表,其中,操作列表包括以下入口至少之一:交换入口、合并入口、覆盖入口;响应于针对交换入口的触发操作,当第二单元格中原先填充有第二信息时,将填充在第一单元格中的第一信息移动至第二单元格中,并将第二信息移动至第一单元格中,当第二单元格为空时,将填充在第一单元格中的第一信息移动至第二单元格中;响应于针对合并入口的触发操作,当第二单元格中原先填充有第二信息时,将填充在第一单元格中的第一信息移动至第二单元格中,以在第二单元格中同时显示第一信息和第二信息(当第二单元格为空时,将填充在第一单元格中的第一信息移动至第二单元格中,以在第二单元格中显示第一信息);响应于针对覆盖入口的触发操作,将第一单元格中填充的第一信息移动至第二单元格中,且第一信息以覆盖第二单元格的方式显示。
示例的,参见图5B,图5B是本申请实施例提供的网页处理方法的应用场景示意图,如图5B所示,在人机交互界面501中显示有对网页进行表格转换后得到的表格文档502,此时,用户可以针对表格文档502进行编辑,例如当接收到用户针对表格文档502中的单元格503的拖动操作,且该拖动操作的当前落点处于表格文档502中的单元格504时,可以显示操作列表(例如在表格文档502中悬浮显示操作列表510),其中,在操作列表510中还显示有交换入口511、合并入口512和覆盖入口513。当接收到用户针对交换入口511的点击操作、且单元格504中原先填充有信息507(例如酒店C的地址信息)时,可以将填充在单元格503中的信息505(例如酒店A的配图)移动至单元格504中,并将单元格504中填充的信息507移动至单元格503中,从而实现单元格503和单元格504中填充的信息之间的互换(当然,当单元格504为空时,可以仅仅将单元格503中填充的信息505移动至单元格504中);当接收到用户针对合并入口512的点击操作、且单元格504中原先填充有信息507时,可以将填充在单元格503中的信息505移动至单元格504中,以在单元格504中同时显示信息505和信息507(当然,当单元格504为空时,可以仅仅在单元格504中显示信息505);当接收到用户针对覆盖入口513的点击操作时,可以将单元格503中填充的信息505移动至单元格504中,且信息505是以覆盖单元格504的方式进行显示的,如此,满足了用户针对文档进行便携编辑的需求。
在一些实施例中,表格文档可以具有两种状态,分别为锁定状态和可编辑状态,其中,锁定状态是屏蔽响应针对表格文档触发的编辑操作的状态,可编辑状态是响应针对表格文档触发的编辑操作的状态,则还可以在人机交互界面中显示状态控件,其中,状态控件用于在被触发时切换表格文档的状态,并以差异化的显示方式表征不同的状态(例如可以以不同的颜色、或者不同的尺寸来表征不同的状态,举例来说,当状态控件显示的颜色为绿色时,表征表格文档处于可编辑状态;当状态控件显示的颜色为红色时,表征表格文档处于锁定状态)。针对上述情况,在对表格文档进行编辑操作之前,如果表格文档当前所处的状态为锁定状态,则在进行编辑操作之前,用户还需要通过点击状态控件,将表格文档所处的状态从锁定状态切换至可编辑状态。
在一些实施例中,当用户需要查看历史表格文档时,还可以通过点击人机交互界面中显示的文档入口进行查看。示例的,可以在人机交互界面中显示文档入口;当接收到用户针对文档入口的点击操作时,在人机交互界面中显示文档详情界面,其中,文档详情界面包括在步骤102中生成的表格文档在内的至少一个表格文档的入口;响应于针对至少一个表格文档中的目标表格文档的入口的触发操作,显示目标表格文档。
示例的,以客户端为浏览器为例,在浏览器提供的人机交互界面的底部显示有导航栏,在导航栏中显示有文档入口;当接收到用户针对文档入口的触发操作时,可以在人机交互界面中显示文档详情界面,在文档详情界面中显示有多个已经生成的表格文档分别对应的入口(例如包括表格文档1的入口、表格文档2的入口和表格文档3的入口),当接收到用户针对表格文档1的入口的点击操作时,可以在人机交互界面中显示表格文档1,如此,方便了用户查看已经生成的历史表格文档。
继续参见图3,在步骤103中,响应于针对表格文档的分享触发操作,以分享对象的身份向至少一个被分享对象发送在线文档形式的表格文档。
这里,在线文档用于供分享对象和至少一个被分享对象进行协同编辑。
在一些实施例中,还可以在人机交互界面中显示分享入口,并将针对分享入口的触发操作,识别为针对表格文档的分享触发操作,此外,在响应于针对表格文档的分享触发操作时,还可以执行以下处理:在人机交互界面中显示多个平台;响应于平台选择操作,在被选中的平台中显示候选对象列表;响应于针对候选对象列表的对象选择操作,将被选中的至少一个候选对象确定为至少一个被分享对象。
示例的,以客户端为浏览器为例,在浏览器提供的人机交互界面中显示有分享入口,当浏览器接收到用户(例如用户A)针对分享入口的点击操作时,在人机交互界面中显示多个平台,例如包括平台A、平台B和平台C;当接收到用户A针对平台B的点击操作时,可以在人机交互界面中显示平台B中与用户A具有社交关系(例如好友关系、或者相互评论、点赞等关系)的多个候选对象组成的候选对象列表,例如假设候选对象列表中包括用户1、用户2、用户3和用户4;当用户A从候选对象列表中选中用户2时,则可以将用户2确定为被分享对象,并向用户2关联的终端设备发送在线文档形式的表格文档,以使用户A和用户2针对在线文档进行协同编辑。
在另一些实施例中,在以分享对象的身份向至少一个被分享对象发送在线文档形式的表格文档之前,还可以通过以下任意一种方式确定至少一个被分享对象:将分享对象的历史发送记录中发送次数大于发送次数阈值(例如5次)的至少一个对象,确定为至少一个被分享对象(例如以分享对象为用户A为例,假设用户A在过去一段时间内向用户1发送在线文档的次数为2次,向用户2发送在线文档的次数为9次,向用户3发送在线文档的次数为4次,则针对本次分享操作,可以自动将用户2确定为被分享对象,并向用户2关联的终端设备发送在线文档形式的表格文档);将与分享对象之间的社交距离(例如可以以两个用户之间的社交关系进行表征,两个用户之间越亲密,则对应的社交距离越短,例如假设用户A和用户B是情侣关系,则可以将用户A与用户B之间的社交距离确定为0.5;假设用户A与用户C是同事关系,则可以将用户A与用户C之间的社交距离确定为1;假设用户A与用户D是朋友关系,则可以将用户A与用户D之间的社交距离确定为0.6)小于社交距离阈值(例如0.5)的至少一个对象,确定为至少一个被分享对象(例如以分享对象为用户A为例,假设用户A与用户1之间的社交距离为0.6,用户A与用户2之间的社交距离为0.4,用户A与用户3之间的社交距离为1,则用户A在分享表格文档时,可以自动将用户2确定为被分享对象,并向用户2关联的终端设备发送在线文档形式的表格文档);将与分享对象属于同一群组(例如会话群组)的至少一个对象,确定为至少一个被分享对象(例如以分享对象为用户A为例,针对用户A所在的会话群组1,可以将会话群组1中与用户A交互的次数大于次数阈值(例如10次)的用户确定为被分享对象,举例来说,假设用户A在过去一段时间内与会话群组1中的用户1交互的次数为8次,与会话群组1中的用户2交互的次数为20次,与会话群组1中的用户3交互的次数为4次,则用户A在分享表格文档时,可以自动将用户2确定为被分享对象,并向用户2关联的终端设备发送在线文档形式的表格文档)。
在一些实施例中,分享对象和至少一个被分享对象针对在线文档进行协同编辑的方式包括:针对在线文档中当前正在被编辑的单元格,在单元格上显示正在被编辑的单元格的编辑对象的标识,其中,编辑对象是分享对象和至少一个被分享对象中的任一对象。示例的,以至少一个被分享对象分别为用户1和用户2为例,假设用户1当前正在编辑在线文档中的单元格1,则可以在单元格1上显示用户1的标识(例如用户1的账号或者头像),如此,方便了其他用户及时了解在线文档的编辑情况,避免了对同一单元格进行重复编辑的情况的发生,进一步提高了用户的编辑效率。
在另一些实施例中,参见图4C,图4C是本申请实施例提供的网页处理方法的流程示意图,如图4C所示,在执行完图3示出的步骤103之后,还可以执行图4C示出的步骤105,将结合图4C示出的步骤105进行说明。
在步骤105中,响应于分享对象和至少一个被分享对象中的任一对象针对在线文档的编辑操作,在人机交互界面中更新显示编辑后的在线文档。
这里,编辑操作的类型可以包括:在线编辑操作和离线编辑操作,其中,针对在线编辑操作,可以在人机交互界面中实时更新显示编辑后的在线文档;针对离线编辑操作,可以在任一对象从离线状态切换至在线状态后,在人机交互界面中更新显示编辑后的在线文档。
示例的,以任一对象为至少一个被分享对象中的用户2为例,用户2可以针对在线文档进行在线编辑操作,也可以针对在线文档进行离线编辑操作,对于用户2针对在线文档触发的在线编辑操作,可以在人机交互界面中实时更新显示编辑后的在线文档;而对于用户2针对在线文档触发的离线编辑操作,当用户2的账号从离线状态切换至在线状态后,获取用户2触发的离线编辑操作,并基于所获取的离线编辑操作对在线文档进行编辑,随后在人机交互界面中更新显示编辑后的在线文档。
本申请实施例提供的网页处理方法,在对网页进行表格转换处理,得到表格文档之后,还可以通过在线文档的形式将得到的表格文档发送给至少一个被分享对象,如此,实现了多人在线协同编辑表格文档的目的,满足了用户针对文档的快速生成、以及便捷编辑的需求,同时也提高了用户的编辑效率。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
相关技术中,用户在通过浏览器浏览网页时,浏览器中的工具箱通常只能提供如下功能:将网页保存为长图、可携带文档格式(PDF,Portable Document Format)、离线网页三种方案,并无将网页转换为表格文档的方案,此外,对于将网页转换为PDF或者长图后的编辑能力也支持有限。
鉴于此,本申请实施例提供一种网页处理方法,能够将网页包括的超文本标记语言(HTML,Hyper Text Markup Language)内容转换为Excel文档(即表格文档),从而满足用户对资讯内容的不同场景需求。具体来说,可以将搜索结果页、电商网页、热门排行榜等,有着明显重复信息组块的网页内容,快速转换为表格文档,同时,本申请实施例还提供了便携的可视化、可多人共享在线编辑的操作能力,提升了用户的操作效率以及完善了工具性产品体验。
下面对本申请实施例提供的网页处理方法进行具体说明。
在一些实施例中,针对浏览器的文档场景,在将网页包括的HTML内容通过智能识别生成表格文档后,还可以针对生成的表格文档进行便携编辑,例如可以通过拖拽表格文档中的某个单元格来实现表格文档中信息的移位。此外,还提供了针对表格文档的多人在线共享编辑的能力,例如可以将表格文档以在线文档的形式分享出去,从而实现多人在线共享编辑。
示例的,参见图6A,图6A是本申请实施例提供的网页处理方法的应用场景示意图,如图6A所示,在浏览器提供的人机交互界面601中显示有工具箱入口,例如“工具箱”按钮602,当浏览器接收到用户针对“工具箱”按钮602的点击操作时,会在人机交互界面601中显示工具箱界面(例如以弹窗的方式显示工具箱界面603,并且在工具箱界面603中显示有表格转换工具,例如“Excel”按钮604)。当浏览器接收到用户针对“Excel”按钮604的点击操作时,会在人机交互界面601中显示与当前网页包括的HTML内容对应的表格文档605,其中,网页包括的多条信息被对应填充在表格文档605的多个单元格中。例如当网页包括的HTML内容含有多组信息时,如含有多家酒店报价信息的网页中,用户在点击工具箱详情界面603中显示的“Excel”按钮604之后,网页包括的多组信息在被分别识别后,可以转换为表格文档,其中,网页包括的多组信息(例如酒店名称、配图、评分、以及价格等)会被对应填充在表格文档的多个单元格中(例如可以将多家酒店的配图填充在表格文档的同一列中,而对于多家酒店的评分可以填充在表格文档的另一列中;此外,针对同一家酒店包括的酒店名称、配图、评分、以及价格等信息可以填充在表格文档的同一行中)。
示例的,参见图6B,图6B是本申请实施例提供的网页处理方法的应用场景示意图,如图6B所示,在得到表格文档605之后,用户还可以通过点击人机交互界面601中显示的状态控件,例如“拖动编辑”按钮606,控制表格文档605进入可编辑状态,从而实现对表格文档的便携编辑。例如,当浏览器接收到用户针对人机交互界面601中显示的“拖动编辑”按钮606的点击操作时,“拖动编辑”按钮606会处于高亮状态,表征表格文档605当前处于可编辑状态。此时,用户可以通过拖拽表格文档605中的某个单元格(例如单元格607)来实现表格文档605中信息的位移,例如在对单元格607进行拖动之后,填充在单元格607中的信息也会跟着进行移动。
在一些实施例中,用户在打开浏览器之后,也可以通过点击底部导航栏中的文件入口,进入文件界面,接着通过点击文件界面显示的“文档”入口进入文档浏览列表,随后可以通过点击文档浏览列表中表格文档的入口打开已生成的表格文档。
示例的,参见图6C,图6C是本申请实施例提供的网页处理方法的应用场景示意图,如图6C所示,在浏览器提供的人机交互界面601中显示有导航栏,在导航栏中显示有文件入口,例如“文件”按钮608,当浏览器接收到用户针对“文件”按钮608的点击操作时,会显示文件界面609,在文件界面609中显示有文档入口,例如“文档”按钮610,当浏览器接收到用户针对“文档”按钮610的点击操作时,会在人机交互界面601中显示文档详情界面,在文档详情界面中显示有已经生成的多个文档组成的文档浏览列表,当浏览器接收到用户针对文档浏览列表中某个文档的入口(例如表格文档605的入口611)的点击操作时,会在人机交互界面中显示表格文档605,从而查看已经生成的表格文档。
下面继续对转换得到的表格文档的编辑过程进行具体说明。
示例的,参见图6D,图6D是本申请实施例提供的网页处理方法的应用场景示意图,如图6D所示,当浏览器接收到用户针对人机交互界面601中显示的“拖动编辑”按钮606的点击操作时,“拖动编辑”按钮606会处于高亮状态,表征表格文档605当前处于可编辑状态,此时,用户可以通过拖拽表格文档605中某个单元格,来改变信息在表格文档605中的排序。例如,当接收到用户将单元格607拖拽至表格文档605中单元格612所在的位置的拖拽操作时,可以将填充在单元格607中的第一信息(例如酒店A的配图)移动至单元格612中,并以覆盖单元格612的方式进行显示。此外,当单元格612中原先填充有第二信息(例如酒店C的评价信息)时,还可以在表格文档605中悬浮显示预览区域613,在预览区域613中显示有原先填充在单元格612中的第二信息、以及位移入口(例如“位移”按钮614)和删除入口(例如“删除”按钮615)。当接收到用户针对“位移”按钮614的点击操作时,可以将填充在单元格612中的第二信息移动至单元格607中;当接收到用户针对“删除”按钮615的点击操作时,可以删除填充在单元格612中的第二信息,如此,实现了对表格文档进行便携编辑的目的。
在另一些实施例中,用户也可以通过分享链接,实现多人在线同时编辑从网页转换得到的表格文档。
示例的,参见图6E,图6E是本申请实施例提供的网页处理方法的应用场景示意图,如图6E所示,当浏览器接收到用户针对人机交互界面601中显示的分享入口,例如“分享”按钮616的点击操作时,会以弹窗的方式显示分享平台界面617,在分享平台界面617中显示有多个候选的平台供用户进行选择。例如用户在选中某个平台之后,还会进一步显示该平台包括的多个候选对象,接着,可以将用户在多个候选对象中选中的对象确定为被分享对象,并以在线文档的形式向被分享对象的客户端(例如浏览器)发送表格文档。继续参见图6E,用户在选择完需要分享的对象之后,可以在人机交互界面601中显示用户选中的被分享对象的头像,并且针对被分享对象进行编辑的单元格,可以在单元格上显示被分享对象的标识,例如当用户的好友1对单元格618进行了编辑,则可以在单元格618上显示好友1的标识;当用户的好友2对单元格619进行了编辑,则可以在单元格619上显示好友2的标识,如此,通过以可视化的方式显示每个被分享对象针对表格文档的编辑过程,方便了用户进行区分。
在一些实施例中,本申请实施例提供的网页处理方法的整个流程会涉及到用户、客户端(例如浏览器)、以及服务器之间的交互,其中,服务器需要分析和识别网页包括的HTML内容,生成相应的数据,以备生成最终的表格文档。
示例的,参见图7,图7是本申请实施例提供的网页处理方法的流程示意图,如图7所示,浏览器在将网页包括的HTML内容转换为图片之后(例如可以通过对当前网页进行截屏的方式),可以将转换得到的图片上传到服务器进行第一次图像识别处理,例如服务器可以将图片中匹配图像模型ID为“事件”的部分识别出来,以将浏览器上传的图片划分为事件1(例如酒店A)图片、事件2(例如酒店B)图片、事件3(例如酒店C)图片等,接着针对每个事件图片,服务器还可以进行第二次图像识别处理,例如以事件1图片为例,服务器还可以将事件1图片中匹配图像模型ID为“单元”的部分识别处理,以将事件1图片进一步划分为单元1图片、单元2图片、单元3图片等,随后可以通过光学字符识别(OCR,Optical CharacterRecognition)获取到每个单元图片对应的数据(例如文本信息)。最后服务器可以将获取到的文本信息以事件进行归类,并按照客户端展示表格文档的格式需求,将获取到的文本信息填充到表格文档对应的单元格中,生成最终的表格文档。
需要说明的是,针对不包含文本信息的单元图片(例如酒店配图),服务器可以通过图像识别处理,对单元图片进行裁切生成图片文件,并将生成的图片文件填充到表格文档中。
示例的,参见图8,图8是本申请实施例提供的从网页转换得到的表格文档的示意图,如图8所示,可以将同一事件包括的多个信息填充在表格文档的同一行中,例如可以将事件1(例如酒店A)包括的多个信息(例如酒店A的配图、地址、评价、名称等)填充在表格文档的第一行,将事件2(例如酒店B)包括的多个信息(例如酒店B的配图、地址、评价、名称等)填充在表格文档的第二行。此外,还可以将同一类型的单元对应的文本信息填充在表格文档的同一列中,例如可以将多个酒店的配图填充在表格文档的第一列中,将多个酒店的地址填充在表格文档的第二列中,将多个酒店的评价填充在表格文档的第三列中,如此,方便了用户进行查看。
在一些实施例中,在得到表格文档之后,用户还可以通过点击人机交互界面中显示的“拖动编辑”按钮,以使表格文档进入可编辑的状态,此时,用户可以通过拖拽表格文档中某个单元格中,实现填充在单元格中的信息在表格文档中的位移。
在另一些实施例中,在得到表格文档之后,用户也可以将该表格文档分享给其他用户,例如向其他用户分享该表格文档的地址,从而使得其他用户能够基于该地址获取到该表格文档,并进行同时编辑的状态。
本申请实施例提供的网页处理方法,满足了网页与表格文档之间的样式转换,打破了内容容器的转换屏障,从而满足了用户对表格文档的快速生成、便携编辑的需求,进一步完善了浏览器工具性产品功能,扩展了用户浏览网页和编辑从网页转换得到的表格文档的使用场景,能够提升用户使用浏览器的时长,提升了用户的使用体验。
下面继续说明本申请实施例提供的网页处理装置465的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器460的网页处理装置465中的软件模块可以包括:显示模块4651和发送模块4652。
显示模块4651,用于在人机交互界面中显示网页;以及用于响应于针对网页的表格转换触发操作,显示对网页进行表格转换后得到的表格文档;其中,网页包括的至少一个信息对应填充在表格文档的至少一个单元格中;发送模块4652,用于响应于针对表格文档的分享触发操作,以分享对象的身份向至少一个被分享对象发送在线文档形式的表格文档;其中,在线文档用于供分享对象和至少一个被分享对象进行协同编辑。
在一些实施例中,显示模块4651,还用于在人机交互界面中显示工具箱入口;以及用于响应于针对工具箱入口的触发操作,显示工具箱界面,其中,工具箱界面包括表格转换工具;网页处理装置465还包括识别模块4653,用于将针对表格转换工具的触发操作,识别为针对网页的表格转换触发操作;显示模块4651,还用于显示对网页进行表格转换后得到的表格文档。
在一些实施例中,人机交互界面是显示于客户端中的,表格转换工具是客户端中的原生的功能。
在一些实施例中,人机交互界面是显示于客户端中的,表格转换工具是客户端中的插件;网页处理装置465还包括下载模块4654和安装模块4655,其中,下载模块4654,用于响应于客户端中未安装插件,从服务器中下载插件;安装模块4655,用于进行插件的安装。
在一些实施例中,网页处理装置465还包括移动模块4656,用于响应于针对表格文档中第一单元格的拖动操作的当前落点处于第二单元格,将第一单元格中填充的第一信息移动至第二单元格中,且第一信息以覆盖第二单元格的方式显示。
在一些实施例中,当第二单元格中原先填充有第二信息时,显示模块4651,还用于将第二信息移动到预览区域中进行显示,其中,预览区域还显示以下至少之一:位移入口、删除入口;移动模块4656,还用于响应于针对位移入口的触发操作,将第二信息从预览区域移动至第一单元格中;网页处理装置465还包括删除模块4657,用于响应于针对删除入口的触发操作,从预览区域中删除第二信息。
在一些实施例中,显示模块4651,还用于响应于针对表格文档中第一单元格的拖动操作的当前落点处于第二单元格,显示操作列表,其中,操作列表包括以下至少之一:交换入口、合并入口、覆盖入口;移动模块4656,还用于响应于针对交换入口的触发操作,当第二单元格中原先填充有第二信息时,将填充在第一单元格中的第一信息移动至第二单元格中,并将第二信息移动至第一单元格中,当第二单元格为空时,将填充在第一单元格中的第一信息移动至第二单元格中;以及用于响应于针对合并入口的触发操作,当第二单元格中原先填充有第二信息时,将填充在第一单元格中的第一信息移动至第二单元格中,以在第二单元格中同时显示第一信息和第二信息;以及用于响应于针对覆盖入口的触发操作,将第一单元格中填充的第一信息移动至第二单元格中,且第一信息以覆盖第二单元格的方式显示。
在一些实施例中,显示模块4651,还用于在人机交互界面中显示状态控件,其中,状态控件用于在被触发时切换表格文档的状态,并以差异化的显示方式表征不同的状态,状态的类型包括:锁定状态和可编辑状态,锁定状态是屏蔽响应针对表格文档触发的编辑操作的状态,可编辑状态是响应针对表格文档触发的编辑操作的状态。
在一些实施例中,显示模块4651,还用于在人机交互界面中显示多个平台;以及用于响应于平台选择操作,在被选中的平台中显示候选对象列表;网页处理装置465还包括确定模块4658,用于响应于针对候选对象列表的对象选择操作,将被选中的至少一个候选对象确定为至少一个被分享对象。
在一些实施例中,确定模块4658,还用于通过以下任意一种方式确定至少一个被分享对象:将分享对象的历史发送记录中发送次数大于发送次数阈值的至少一个对象,确定为至少一个被分享对象;将与分享对象之间的社交距离小于社交距离阈值的至少一个对象,确定为至少一个被分享对象;将与分享对象属于同一群组的至少一个对象,确定为至少一个被分享对象。
在一些实施例中,显示模块4651,还用于在人机交互界面中显示文档入口;以及用于响应于针对文档入口的触发操作,显示文档详情界面,其中,文档详情界面包括表格文档在内的至少一个表格文档的入口;以及用于响应于针对至少一个表格文档中的目标表格文档的入口的触发操作,显示目标表格文档。
在一些实施例中,分享对象和至少一个被分享对象针对在线文档进行协同编辑的方式包括:针对在线文档中当前正在被编辑的单元格,在单元格上显示正在被编辑的单元格的编辑对象的标识,其中,编辑对象是分享对象和至少一个被分享对象中的任一对象。
在一些实施例中,显示模块4651,还用于响应于分享对象和至少一个被分享对象中的任一对象针对在线文档的编辑操作,在人机交互界面中更新显示编辑后的在线文档;其中,编辑操作的类型包括:在线编辑操作和离线编辑操作;其中,针对在线编辑操作,在人机交互界面中实时更新显示编辑后的在线文档;其中,针对离线编辑操作,在任一对象从离线状态切换至在线状态后,在人机交互界面中更新显示编辑后的在线文档。
在一些实施例中,网页处理装置465还包括转换模块4659、图像识别模块46510、创建模块46511和填充模块46512,其中,转换模块4659,用于将网页转换为图片;图像识别模块46510,用于对图片进行图像识别处理,得到图片包括的至少一个信息;创建模块46511,用于创建空表格文档;填充模块46512,用于将图片包括的至少一个信息对应填充在空表格文档的至少一个单元格中,得到表格文档。
在一些实施例中,图像识别模块46510,还用于调用第一图像识别模型对图片进行第一图像识别处理,以将图片划分为至少一个事件图片;其中,第一图像识别模型是基于样本图片、以及在样本图片中标注出的至少一个样本事件所对应的区域进行训练得到的;调用第二图像识别模型对每个事件图片进行第二图像识别处理,以将每个事件图片划分为至少一个单元图片;其中,第二图像识别模型是基于样本事件图片、以及在样本事件图片中标注出的至少一个样本单元所对应的区域进行训练得到的,样本单元是样本事件的元素;针对每个单元图片进行光学字符识别处理,得到图片包括的至少一个信息。
在一些实施例中,图像识别模块46510,还用于针对每个单元图片进行光学字符识别处理,当识别成功时,将识别出的文本信息确定为图片包括的一个文本信息;当识别失败时,将单元图片确定为图片包括的一个图片信息;填充模块46512,用于针对每个事件图片执行以下处理:将事件图片包括的至少一个单元图片分别对应的文本信息或者至少一个单元图片,对应填充在空表格文档的同一行或者同一列包括的至少一个单元格中。
在一些实施例中,网页处理装置465还包括解析模块46513和获取模块46514,其中,解析模块46513,用于对网页的代码源数据进行解析,得到网页包括的多个网页标签;获取模块46514,用于基于多个网页标签中的至少一个目标网页标签,获取至少一个信息;其中,网页标签的类型包括文本标签和图片标签,每个文本标签指定了网页中对应显示的一个文本信息,每个图片标签指定了网页中对应显示的一个图片信息;创建模块46511,用于创建空表格文档;填充模块46512,用于将至少一个信息对应填充在空表格文档的至少一个单元格中,得到表格文档。
需要说明的是,本申请实施例装置的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本申请实施例提供的网页处理装置中未尽的技术细节,可以根据图3、图4B、或图4C任一附图的说明而理解。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令(即可执行指令),该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行本申请实施例上述的网页处理方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的网页处理方法,例如,如图3、图4B、或图4C示出的网页处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个电子设备上执行,或者在位于一个地点的多个电子设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (20)
1.一种网页处理方法,其特征在于,所述方法包括:
在人机交互界面中显示网页;
响应于针对所述网页的表格转换触发操作,将所述网页转换为图片;
对所述图片进行第一图像识别处理,以将所述图片划分为至少一个事件图片;
对每个所述事件图片进行第二图像识别处理,以将每个所述事件图片划分为至少一个单元图片;
针对每个所述单元图片进行光学字符识别处理,得到所述图片包括的至少一个信息;
创建空表格文档,并将所述图片包括的至少一个信息对应填充在所述空表格文档的至少一个单元格中,得到在线文档形式的表格文档;
显示对所述网页进行表格转换后得到的所述表格文档;其中,所述网页包括的至少一个信息对应填充在所述表格文档的至少一个单元格中;
响应于针对所述表格文档的分享触发操作,以分享对象的身份向至少一个被分享对象发送在线文档形式的所述表格文档;其中,所述在线文档用于供所述分享对象和所述至少一个被分享对象进行协同编辑。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述人机交互界面中显示工具箱入口;
响应于针对所述工具箱入口的触发操作,显示工具箱界面,其中,所述工具箱界面包括表格转换工具;
将针对所述表格转换工具的触发操作,识别为针对所述网页的表格转换触发操作。
3.根据权利要求2所述的方法,其特征在于,
所述人机交互界面是显示于客户端中的,所述表格转换工具是所述客户端中的原生的功能。
4.根据权利要求2所述的方法,其特征在于,
所述人机交互界面是显示于客户端中的,所述表格转换工具是所述客户端中的插件;
在所述工具箱界面中显示所述插件之前,所述方法还包括:
响应于所述客户端中未安装所述插件,从服务器中下载所述插件,并进行所述插件的安装。
5.根据权利要求1所述的方法,其特征在于,在显示对所述网页进行表格转换后得到的所述表格文档之后,所述方法还包括:
响应于针对所述表格文档中第一单元格的拖动操作的当前落点处于第二单元格,将所述第一单元格中填充的第一信息移动至所述第二单元格中,且所述第一信息以覆盖所述第二单元格的方式显示。
6.根据权利要求5所述的方法,其特征在于,当所述第二单元格中原先填充有第二信息时,所述方法还包括:
将所述第二信息移动到预览区域中进行显示,其中,所述预览区域还显示以下至少之一:位移入口、删除入口;
响应于针对所述位移入口的触发操作,将所述第二信息从所述预览区域移动至所述第一单元格中;
响应于针对所述删除入口的触发操作,从所述预览区域中删除所述第二信息。
7.根据权利要求1所述的方法,其特征在于,在显示对所述网页进行表格转换后得到的所述表格文档之后,所述方法还包括:
响应于针对所述表格文档中第一单元格的拖动操作的当前落点处于第二单元格,显示操作列表,其中,所述操作列表包括以下至少之一:交换入口、合并入口、覆盖入口;
响应于针对所述交换入口的触发操作,当所述第二单元格中原先填充有第二信息时,将填充在所述第一单元格中的第一信息移动至所述第二单元格中,并将所述第二信息移动至所述第一单元格中,当所述第二单元格为空时,将填充在所述第一单元格中的第一信息移动至所述第二单元格中;
响应于针对所述合并入口的触发操作,当所述第二单元格中原先填充有第二信息时,将填充在所述第一单元格中的第一信息移动至所述第二单元格中,以在所述第二单元格中同时显示所述第一信息和所述第二信息;
响应于针对所述覆盖入口的触发操作,将所述第一单元格中填充的第一信息移动至所述第二单元格中,且所述第一信息以覆盖所述第二单元格的方式显示。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述人机交互界面中显示状态控件,其中,所述状态控件用于在被触发时切换所述表格文档的状态,并以差异化的显示方式表征不同的状态,所述状态的类型包括:锁定状态和可编辑状态,所述锁定状态是屏蔽响应针对所述表格文档触发的编辑操作的状态,所述可编辑状态是响应针对所述表格文档触发的编辑操作的状态。
9.根据权利要求1所述的方法,其特征在于,在响应于针对所述表格文档的分享触发操作时,所述方法还包括:
在所述人机交互界面中显示多个平台;
响应于平台选择操作,在被选中的平台中显示候选对象列表;
响应于针对所述候选对象列表的对象选择操作,将被选中的至少一个候选对象确定为所述至少一个被分享对象。
10.根据权利要求1所述的方法,其特征在于,在以分享对象的身份向至少一个被分享对象发送在线文档形式的所述表格文档之前,所述方法还包括:
通过以下任意一种方式确定所述至少一个被分享对象:
将所述分享对象的历史发送记录中发送次数大于发送次数阈值的至少一个对象,确定为所述至少一个被分享对象;
将与所述分享对象之间的社交距离小于社交距离阈值的至少一个对象,确定为所述至少一个被分享对象;
将与所述分享对象属于同一群组的至少一个对象,确定为所述至少一个被分享对象。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述人机交互界面中显示文档入口;
响应于针对所述文档入口的触发操作,显示文档详情界面,其中,所述文档详情界面包括所述表格文档在内的至少一个表格文档的入口;
响应于针对所述至少一个表格文档中的目标表格文档的入口的触发操作,显示所述目标表格文档。
12.根据权利要求1所述的方法,其特征在于,
所述分享对象和所述至少一个被分享对象针对所述在线文档进行协同编辑的方式包括:
针对所述在线文档中当前正在被编辑的单元格,在所述单元格上显示所述正在被编辑的单元格的编辑对象的标识,其中,所述编辑对象是所述分享对象和所述至少一个被分享对象中的任一对象。
13.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述分享对象和所述至少一个被分享对象中的任一对象针对所述在线文档的编辑操作,在所述人机交互界面中更新显示编辑后的所述在线文档;
其中,所述编辑操作的类型包括:在线编辑操作和离线编辑操作;
其中,针对所述在线编辑操作,在所述人机交互界面中实时更新显示编辑后的所述在线文档;
其中,针对所述离线编辑操作,在所述任一对象从离线状态切换至在线状态后,在所述人机交互界面中更新显示编辑后的所述在线文档。
14.根据权利要求1所述的方法,其特征在于,所述对所述图片进行第一图像识别处理,以将所述图片划分为至少一个事件图片,包括:
调用第一图像识别模型对所述图片进行第一图像识别处理,以将所述图片划分为至少一个事件图片;其中,所述第一图像识别模型是基于样本图片、以及在所述样本图片中标注出的至少一个样本事件所对应的区域进行训练得到的;
所述对每个所述事件图片进行第二图像识别处理,以将每个所述事件图片划分为至少一个单元图片,包括:
调用第二图像识别模型对每个所述事件图片进行第二图像识别处理,以将每个所述事件图片划分为至少一个单元图片;其中,所述第二图像识别模型是基于样本事件图片、以及在所述样本事件图片中标注出的至少一个样本单元所对应的区域进行训练得到的,所述样本单元是所述样本事件的元素。
15.根据权利要求1所述的方法,其特征在于,所述针对每个所述单元图片进行光学字符识别处理,得到所述图片包括的至少一个信息,包括:
针对每个所述单元图片进行光学字符识别处理,当识别成功时,将识别出的文本信息确定为所述图片包括的一个文本信息;当识别失败时,将所述单元图片确定为所述图片包括的一个图片信息;
所述将所述图片包括的至少一个信息对应填充在所述空表格文档的至少一个单元格中,包括:
针对每个所述事件图片执行以下处理:
将所述事件图片包括的至少一个单元图片分别对应的文本信息或者所述至少一个单元图片,对应填充在所述空表格文档的同一行或者同一列包括的至少一个单元格中。
16.根据权利要求1所述的方法,其特征在于,在所述显示对所述网页进行表格转换后得到的所述表格文档之前,所述方法还包括:
对所述网页的代码源数据进行解析,得到所述网页包括的多个网页标签;
基于所述多个网页标签中的至少一个目标网页标签,获取至少一个信息;其中,所述网页标签的类型包括文本标签和图片标签,每个所述文本标签指定了所述网页中对应显示的一个文本信息,每个所述图片标签指定了所述网页中对应显示的一个图片信息;
创建空表格文档,并将所述至少一个信息对应填充在所述空表格文档的至少一个单元格中,得到所述表格文档。
17.一种网页处理装置,其特征在于,所述网页处理装置包括:
显示模块,用于在人机交互界面中显示网页;
所述显示模块,还用于响应于针对所述网页的表格转换触发操作,将所述网页转换为图片;
图像识别模块,用于对所述图片进行第一图像识别处理,以将所述图片划分为至少一个事件图片;对每个所述事件图片进行第二图像识别处理,以将每个所述事件图片划分为至少一个单元图片;针对每个所述单元图片进行光学字符识别处理,得到所述图片包括的至少一个信息;
创建模块,用于创建空表格文档;
填充模块,用于将所述图片包括的至少一个信息对应填充在所述空表格文档的至少一个单元格中,得到在线文档形式的表格文档;
所述显示模块,还用于显示对所述网页进行表格转换后得到的所述表格文档;其中,所述网页包括的至少一个信息对应填充在所述表格文档的至少一个单元格中;
发送模块,用于响应于针对所述表格文档的分享触发操作,以分享对象的身份向至少一个被分享对象发送在线文档形式的所述表格文档;其中,所述在线文档用于供所述分享对象和所述至少一个被分享对象进行协同编辑。
18.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至16任一项所述的网页处理方法。
19.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于被处理器执行时,实现权利要求1至16任一项所述的网页处理方法。
20.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时,实现权利要求1至16任一项所述的网页处理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202210225086.2A CN114595191B (zh) | 2022-03-09 | 2022-03-09 | 网页处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202210225086.2A CN114595191B (zh) | 2022-03-09 | 2022-03-09 | 网页处理方法、装置、电子设备及存储介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN114595191A CN114595191A (zh) | 2022-06-07 |
| CN114595191B true CN114595191B (zh) | 2025-04-11 |
Family
ID=81808103
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202210225086.2A Active CN114595191B (zh) | 2022-03-09 | 2022-03-09 | 网页处理方法、装置、电子设备及存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN114595191B (zh) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115277701B (zh) * | 2022-07-25 | 2025-09-02 | 明阳产业技术研究院(沈阳)有限公司 | 一种集群系统的网络管理方法、装置、介质、电子设备 |
| CN116319731A (zh) * | 2022-09-06 | 2023-06-23 | 北京达佳互联信息技术有限公司 | 在线文档的发送方法、装置、电子设备及存储介质 |
| CN115600569A (zh) * | 2022-10-24 | 2023-01-13 | 北京字跳网络技术有限公司(Cn) | 信息处理方法、装置、电子设备及存储介质 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101226548A (zh) * | 2008-01-11 | 2008-07-23 | 孟小峰 | 基于视觉的Web数据抽取系统和方法 |
| CN111507352A (zh) * | 2020-04-16 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、计算机设备以及存储介质 |
| CN113268964A (zh) * | 2020-07-23 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 一种表格编辑方法、装置、设备及存储介质 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FI118310B (fi) * | 2004-01-22 | 2007-09-28 | Nokia Corp | Verkkosivun esittäminen selainikkunassa ja menetelmä verkkosivun käsittelemiseksi |
| CN106528271A (zh) * | 2015-09-11 | 2017-03-22 | 北京国双科技有限公司 | 网页数据获取的方法及装置 |
| CN106610774B (zh) * | 2015-10-23 | 2020-03-31 | 北京国双科技有限公司 | 网页表格编辑方法及装置 |
| CN110334585B (zh) * | 2019-05-22 | 2023-10-24 | 平安科技(深圳)有限公司 | 表格识别方法、装置、计算机设备和存储介质 |
| CN110991403A (zh) * | 2019-12-19 | 2020-04-10 | 同方知网(北京)技术有限公司 | 一种基于视觉深度学习的文档信息碎片化抽取方法 |
| CN112560411A (zh) * | 2020-12-21 | 2021-03-26 | 深圳供电局有限公司 | 一种人员信息智能录入方法及其系统 |
| CN113849552B (zh) * | 2021-09-27 | 2024-05-31 | 中国平安财产保险股份有限公司 | 结构化数据转换方法、装置、电子设备及介质 |
| CN113850068A (zh) * | 2021-09-28 | 2021-12-28 | 上海临冠数据科技有限公司 | 一种保持版式的将图片转换为可编辑文本的方法及装置 |
| CN113936286B (zh) * | 2021-11-29 | 2024-06-14 | 中国平安人寿保险股份有限公司 | 图像文本识别方法、装置、计算机设备及存储介质 |
-
2022
- 2022-03-09 CN CN202210225086.2A patent/CN114595191B/zh active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101226548A (zh) * | 2008-01-11 | 2008-07-23 | 孟小峰 | 基于视觉的Web数据抽取系统和方法 |
| CN111507352A (zh) * | 2020-04-16 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、计算机设备以及存储介质 |
| CN113268964A (zh) * | 2020-07-23 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 一种表格编辑方法、装置、设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN114595191A (zh) | 2022-06-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN114595191B (zh) | 网页处理方法、装置、电子设备及存储介质 | |
| CN112632942B (zh) | 一种文档处理方法、装置、设备及介质 | |
| US10255253B2 (en) | Augmenting and presenting captured data | |
| US10853319B2 (en) | System and method for display of document comparisons on a remote device | |
| US11720376B2 (en) | Methods and systems for content generation via templates with rules and/or triggers | |
| US20050240857A1 (en) | Methods and systems of information portal construction | |
| CN104142826A (zh) | 页面的构建方法、装置及系统 | |
| CN109656651A (zh) | 网页自定义方法及装置 | |
| WO2017080007A1 (zh) | 一种识别码智能分析处理系统及其处理方法 | |
| CN111934985A (zh) | 媒体内容的分享方法、装置、设备及计算机可读存储介质 | |
| CN116701811A (zh) | 一种网页处理方法、装置、设备及计算机可读存储介质 | |
| CN112835860B (zh) | 共享文档的处理方法、装置、设备及计算机可读存储介质 | |
| WO2024164589A1 (zh) | 信息显示方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
| CN110020279A (zh) | 页面数据处理方法、装置及存储介质 | |
| HK40070963A (zh) | 网页处理方法、装置、电子设备及存储介质 | |
| CN115344148A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
| US20250200852A1 (en) | Communication system, information processing apparatus, terminal device, and information processing method | |
| CN120011616A (zh) | 兴趣点显示方法、装置、计算设备及计算机可读存储介质 | |
| CN118733909A (zh) | 搜索处理方法、装置、电子设备及存储介质 | |
| CN119903149A (zh) | 一种知识问答方法、装置、设备、介质及程序产品 | |
| HK40042439A (zh) | 一种文档处理方法、装置、设备及介质 | |
| HK40042439B (zh) | 一种文档处理方法、装置、设备及介质 | |
| CN120632231A (zh) | 内容搜索方法及装置 | |
| CN120469609A (zh) | 信息采集方法、装置、电子设备及存储介质 | |
| CN119179820A (zh) | 页面的操作引导配置方法、页面显示方法及装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40070963 Country of ref document: HK |
|
| GR01 | Patent grant | ||
| GR01 | Patent grant |