MySQL 之动态字符串处理
MySQL中,常常会看到一些关于动态字符串的处理,列如:DYNAMIC_STRING。为了记录动态字符串的实际长度,缓冲区的最大长度,以及每次字符串需要调整时,及时分配新的内存,以及调整长度。MySQL使用了DYNAMIC_STRING来保存动态字符串相关的信息:<ol style="margin:0 1px 0 0px;padding-left:40px;" start="1" class="dp-css"><li>typedef struct st_dynamic_string<br /> </li><li>{<br /></li><li>char *str;<br /></li><li>size_t length,max_length,alloc_increment;<br /></li><li>} DYNAMIC_STRING; </li></ol>在这个结构体中,str存储实际字符串的首地址,length记录字符串的实际长度,max_length记录字符串缓冲区最多可以存放多少字符,alloc_increment表示当字符串需要分配内存时,每次分配多少内存。
下面看看这个结构体的初始化过程:
<ol style="margin:0 1px 0 0px;padding-left:40px;" start="1" class="dp-css"><li>my_bool init_dynamic_string(DYNAMIC_STRING *str, const char *init_str,size_t init_alloc, size_t alloc_increment)<br /> </li><li>{<br /></li><li>size_t length;<br /></li><li>DBUG_ENTER("init_dynamic_string");<br /></li><li><br /></li><li>if (!alloc_increment) <br /></li><li>alloc_increment=128;<br /></li><li>length=1;<br /></li><li>if (init_str && (length= strlen(init_str)+1) < init_alloc) <br /></li><li>init_alloc=((length+alloc_increment-1)/alloc_increment)*alloc_increment; <br /></li><li>if (!init_alloc)<br /></li><li>init_alloc=alloc_increment;<br /></li><li><br /></li><li>if (!(str->str=(char*) my_malloc(init_alloc,MYF(MY_WME))))<br /></li><li>DBUG_RETURN(TRUE);<br /></li><li>str->length=length-1;<br /></li><li>if (init_str)<br /></li><li>memcpy(str->str,init_str,length);<br /></li><li>str->max_length=init_alloc;<br /></li><li>str->alloc_increment=alloc_increment;<br /></li><li>DBUG_RETURN(FALSE);<br /></li><li>} </li></ol>从上述函数可以看到,初始化时,初始分配的字符串缓冲区大小init_alloc会根据需要初始的字符串来做判断。在分配好该DYNAMIC_STRING空间之后,我们会根据缓冲区的大小,字符串的实际长度,以及alloc_increment来初始化:length:字符串的实际长度max_length:缓冲区的最大长度alloc_increment:空间不够时,下次分配内存的单元大小.
初始化这些内容之后,如果下次需要在该缓冲区添加更多字符,就可以根据这些值来判断是否需要对该缓冲区扩容:
<ol style="margin:0 1px 0 0px;padding-left:40px;" start="1" class="dp-css"><li>my_bool dynstr_append_mem(DYNAMIC_STRING *str, const char *append,<br /> </li><li>size_t length)<br /></li><li>{<br /></li><li>char *new_ptr;<br /></li><li>if (str->length+length >= str->max_length) //如果新增字符串后,总长度超过缓冲区大小<br /></li><li>{<br /></li><li>//需要分配多少个alloc_increment 大小的内存,才能存下新增后的字符串<br /></li><li>size_t new_length=(str->length+length+str->alloc_increment)/<br /></li><li>str->alloc_increment; <br /></li><li>new_length*=str->alloc_increment;<br /></li><li><br /></li><li>if (!(new_ptr=(char*) my_realloc(str->str,new_length,MYF(MY_WME))))<br /></li><li>return TRUE;<br /></li><li>str->str=new_ptr;<br /></li><li>str->max_length=new_length;<br /></li><li>}<br /></li><li>//将新分配的内容,append到str之后<br /></li><li>memcpy(str->str + str->length,append,length);<br /></li><li>str->length+=length; //扩容之后str新的长度<br /></li><li>str->str[str->length]=0; /* Safety for C programs */ //字符串最后一个字符为’\0'<br /></li><li>return FALSE;<br /></li><li>} </li></ol>从上述代码可以看到,在字符串初始化化好之后,之后如果需要给该字符串增加新的内容,只需要根据之前存储的信息来动态的realloc就好了。由于该结构体记录了字符串相关的完整内容,所以动态的扩容会非常方便处理。
当然,除了这些,还有比如字符串截断,字符串初始设置,转义OS的引号等等:将字符串偏移大于N之后的截断。
<ol style="margin:0 1px 0 0px;padding-left:40px;" start="1" class="dp-css"><li>my_bool dynstr_trunc(DYNAMIC_STRING *str, size_t n)<br /> </li><li>{<br /></li><li>str->length-=n;<br /></li><li>str->str[str->length]= '\0';<br /></li><li>return FALSE;<br /></li><li>} </li></ol>返回字符串中第一次出现某个字符的地址。若没有,则返回字符串结尾的地址(指向’\0')
<ol style="margin:0 1px 0 0px;padding-left:40px;" start="1" class="dp-css"><li>char *strcend(register const char *s, register pchar c)<br /> </li><li>{<br /></li><li>for (;;)<br /></li><li>{<br /></li><li>if (*s == (char) c) return (char*) s;<br /></li><li>if (!*s++) return (char*) s-1;<br /></li><li>}<br /></li><li>} </li></ol>字符串内容扩容:
<ol style="margin:0 1px 0 0px;padding-left:40px;" start="1" class="dp-css"><li>my_bool dynstr_realloc(DYNAMIC_STRING *str, size_t additional_size)<br /> </li><li>{<br /></li><li>DBUG_ENTER("dynstr_realloc");<br /></li><li><br /></li><li>if (!additional_size) DBUG_RETURN(FALSE);<br /></li><li>if (str->length + additional_size > str->max_length) //如果新的字符串内容超过缓冲区的最大长度<br /></li><li>{<br /></li><li>str->max_length=((str->length + additional_size+str->alloc_increment-1)/<br /></li><li>str->alloc_increment)*str->alloc_increment;<br /></li><li>if (!(str->str=(char*) my_realloc(str->str,str->max_length,MYF(MY_WME))))<br /></li><li>DBUG_RETURN(TRUE);<br /></li><li>}<br /></li><li>DBUG_RETURN(FALSE);<br /></li><li>} </li></ol>对字符串用引号括起来,对其中的单引号进行转义,主要用于执行一些系统命令(system(cmd))。比如:ls -al 会变成 \'ls -al\'比如:ls -a’l会变成\’ls -a\\\’l\'
<ol style="margin:0 1px 0 0px;padding-left:40px;" start="1" class="dp-css"><li>/*<br /> </li><li>Concatenates any number of strings, escapes any OS quote in the result then<br /></li><li>surround the whole affair in another set of quotes which is finally appended<br /></li><li>to specified DYNAMIC_STRING. This function is especially useful when<br /></li><li>building strings to be executed with the system() function.<br /></li><li><br /></li><li>@param str Dynamic String which will have addtional strings appended.<br /></li><li>@param append String to be appended.<br /></li><li>@param ... Optional. Additional string(s) to be appended.<br /></li><li><br /></li><li>@note The final argument in the list must be NullS even if no additional<br /></li><li>options are passed.<br /></li><li><br /></li><li>@return True = Success.<br /></li><li>*/<br /></li><li><br /></li><li>my_bool dynstr_append_os_quoted(DYNAMIC_STRING *str, const char *append, ...)<br /></li><li>{<br /></li><li><br /></li><li>const char *quote_str= "\'";<br /></li><li>const uint quote_len= 1;<br /></li><li>my_bool ret= TRUE;<br /></li><li>va_list dirty_text;<br /></li><li><br /></li><li>ret&= dynstr_append_mem(str, quote_str, quote_len); /* Leading quote */<br /></li><li>va_start(dirty_text, append);<br /></li><li>while (append != NullS)<br /></li><li>{<br /></li><li>const char *cur_pos= append;<br /></li><li>const char *next_pos= cur_pos;<br /></li><li><br /></li><li>/* Search for quote in each string and replace with escaped quote */<br /></li><li>while(*(next_pos= strcend(cur_pos, quote_str[0])) != '\0')<br /></li><li>{<br /></li><li>ret&= dynstr_append_mem(str, cur_pos, (uint) (next_pos - cur_pos));<br /></li><li>ret&= dynstr_append_mem(str ,"\\", 1);<br /></li><li>ret&= dynstr_append_mem(str, quote_str, quote_len);<br /></li><li>cur_pos= next_pos + 1;<br /></li><li>}<br /></li><li>ret&= dynstr_append_mem(str, cur_pos, (uint) (next_pos - cur_pos));<br /></li><li>append= va_arg(dirty_text, char *);<br /></li><li>}<br /></li><li>va_end(dirty_text);<br /></li><li>ret&= dynstr_append_mem(str, quote_str, quote_len); /* Trailing quote */<br /></li><li><br /></li><li>return ret;<br /></li><li>} </li></ol>通过定义动态字符串的结构体信息,每次分次进行字符串添加更多字符,都会根据字符串的当前的长度动态的扩容。而且每次扩容后,该结构体都记录的当前字符串的实际信息(当前字符串的长度,缓冲器可容纳字符串的长度,进行扩容的单元长度)。这样,动态字符串的处理操作就变得非常方便了。

PHP主要是过程式编程,但也支持面向对象编程(OOP);Python支持多种范式,包括OOP、函数式和过程式编程。PHP适合web开发,Python适用于多种应用,如数据分析和机器学习。

PHP起源于1994年,由RasmusLerdorf开发,最初用于跟踪网站访问者,逐渐演变为服务器端脚本语言,广泛应用于网页开发。Python由GuidovanRossum于1980年代末开发,1991年首次发布,强调代码可读性和简洁性,适用于科学计算、数据分析等领域。

PHP适合网页开发和快速原型开发,Python适用于数据科学和机器学习。1.PHP用于动态网页开发,语法简单,适合快速开发。2.Python语法简洁,适用于多领域,库生态系统强大。

PHP在现代化进程中仍然重要,因为它支持大量网站和应用,并通过框架适应开发需求。1.PHP7提升了性能并引入了新功能。2.现代框架如Laravel、Symfony和CodeIgniter简化开发,提高代码质量。3.性能优化和最佳实践进一步提升应用效率。

PHPhassignificantlyimpactedwebdevelopmentandextendsbeyondit.1)ItpowersmajorplatformslikeWordPressandexcelsindatabaseinteractions.2)PHP'sadaptabilityallowsittoscaleforlargeapplicationsusingframeworkslikeLaravel.3)Beyondweb,PHPisusedincommand-linescrip

PHP类型提示提升代码质量和可读性。1)标量类型提示:自PHP7.0起,允许在函数参数中指定基本数据类型,如int、float等。2)返回类型提示:确保函数返回值类型的一致性。3)联合类型提示:自PHP8.0起,允许在函数参数或返回值中指定多个类型。4)可空类型提示:允许包含null值,处理可能返回空值的函数。

PHP中使用clone关键字创建对象副本,并通过\_\_clone魔法方法定制克隆行为。1.使用clone关键字进行浅拷贝,克隆对象的属性但不克隆对象属性内的对象。2.通过\_\_clone方法可以深拷贝嵌套对象,避免浅拷贝问题。3.注意避免克隆中的循环引用和性能问题,优化克隆操作以提高效率。

PHP适用于Web开发和内容管理系统,Python适合数据科学、机器学习和自动化脚本。1.PHP在构建快速、可扩展的网站和应用程序方面表现出色,常用于WordPress等CMS。2.Python在数据科学和机器学习领域表现卓越,拥有丰富的库如NumPy和TensorFlow。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Atom编辑器mac版下载
最流行的的开源编辑器

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。