❶ 怎么读取html文件的内容
读取html文件的内容方法如下:
1、找到.HTML文件的位置;
❷ c语言提取html标签内容
#include <stdio.h>
#include <math.h>
void fetch_str(char *str_in, char *str_out);
int main(){
char test[] = "<a>This is the <...> string</a>";
char result[256];
fetch_str(test, result);
printf("\ntest\t=%s\n", test);
printf("\nresult\t=%s\n",result);
return 1;
}
void fetch_str(char *str_in, char *str_out)
{
char begin_str[] = "<a>";
char end_str[] = "</a>";
int index_end =0;
int index_begin=0;
int flag_begin =0;
int flag_end =0;
int str_index=0;
int i;
// to find the max index of str_in
while(str_in[str_index]!='\0')
{
str_index++;
}
str_index--;
//printf("%s %s", begin_str, end_str);
int count=0;
while(str_in[count]!='\0')
{
// to find the begin index of the target string
if( flag_begin==0 && count<=(str_index-2) )
{
if( str_in[count]==begin_str[0] && str_in[count+1]==begin_str[1] && str_in[count+2]==begin_str[2] )
{
flag_begin=1;
index_begin=count+3;
}
}
// to find the end index of the target string
//if( flag_end==0 && count<=(str_index-3) )
if(count<=(str_index-3) )
{
if( str_in[count]==end_str[0] && str_in[count+1]==end_str[1] && str_in[count+2]==end_str[2] && str_in[count+3]==end_str[3])
{
flag_end=1;
index_end=count-1;
}
}
count++;
}
//printf("\nbegin_index=%d, end_index=%d\n", index_begin, index_end);
// to the target string to str_out
count=0;
for(i=index_begin;i<=index_end;i++)
{
str_out[count]=str_in[i];
count++;
}
str_out[count]='\0';
return;
}
❸ c++如何读取HTML文件源代码
这要用到MFC类库
1.添加头文件 #include <afxinet.h>
2.添加代码
CString strAddress="http://www..com";
CInternetSession mySession(NULL,0);
CHttpFile* myHttpFile=NULL;
CString strsource,strline;
myHttpFile=(CHttpFile*)mySession.OpenURL(strAddress);
while(myHttpFile->ReadString(strline))
{
strsource+=strline;
strsource+="\r\n";
}
myHttpFile->Close();
mySession.Close();
strsource存储的就是html源代码。
❹ 如何用C语言实现解析HTML文档
参考下面代码:
#include <stdio.h>
#include <streamhtmlparser/htmlparser.h>
int main(void)
{
unsigned int getchar_ret;
htmlparser_ctx *parser = htmlparser_new();
while ((getchar_ret = getchar()) != EOF) {
char c = (char)getchar_ret;
/* If we received a '$' character, we output the current tag and attribute
* * name to stdout. */
if (c == '$') {
printf("[[ ");
if (htmlparser_tag(parser)) printf("tag=%s ", htmlparser_tag(parser));
if (htmlparser_attr(parser)) printf("attr=%s ", htmlparser_attr(parser));
printf("]]");
/* If we read any other character, we pass it to the parser and echo it to
* * stdout. */
} else {
htmlparser_parse_chr(parser, c);
putchar(c);
}
}
}
❺ c语言获取html文件问题
这个b0e是十六进制数,是后面正文的长度,是图片还是其它文件,在传输协议头中会指明文件类型,要解读这些东西,必须熟悉http传输协议。
❻ 如何运用C语言读取任意一个html
1. 首先定义一个File 的变量
2.然后用
FILE *fopen(
const char *filename,
const char *mode
);
这个函数读入 html 文件
3.用这个读入文件内容
size_t fread(
void *buffer,
size_t size,
size_t count,
FILE *stream
);
4.之后进行字符数组的处理
❼ 怎么用html打开C语言 ,,并且能够在html中运行C语言的代码
C语言是程序语言的鼻祖。不过要想在html中运行c?这我就不理解了。你到底要干什么?
我们可以把c的exe文件跟html文件打包,从而执行c。也可以用Js把c源码直接拿出来,展示在浏览器上。至于要让c语言在网页中发挥作用吗?也不是不行,没有c语言做不到的事情。但是就没有那个必要了。
方法吗?很白痴,就是用c语言控制浏览器进程。通过注射来改变进程的值,以达到改变用户端的code资料。
或许你想让html能内嵌一个c语言程序。这个意思也就是内嵌一个exe进程在html中。这不就和上面的想法一样了吗?用木马的办法绑起来就可以了。
顺便说一句,c语言功能虽然强大。其他任何语言能做到的,他都能做到。不过,在某些特定的领域中,不宜用。因为麻烦。例如,你要改变一个值,你用js和用c。那个更容易定位一个变量呢?js和html的关系毕竟就是亲,他们之间的调用也方便许多。js也能直接访问code资料。基本html中的功能使用js都能实现,何必再用c?
如果真的有些问题,必须要用c来解决,还望提出一起讨论。
❽ c语言提取html中的信息
1. 如果你懂编程序:
使用字符串匹配算法,例如KMP算法,AC算法等。
AC算法比较好,网络上可能有现成的,弄一个源代码,再修改下就可以。
2. 如果你不懂编程:
用word,ultraedit等编辑工具,直接搜索你要的字符串就可以了吧。