处理字符串,尤其是处理一些很凌乱的字符串是作为一个 Pythoner ,基本上都要面对的事情。就比如去除字符串里那些重复和没必要的空格。
不过,不管这些被风吹散的字符串,有多么的凌乱,在 Python 里总能找到合适的方法将它变得有序起来。
今天这篇文件就针对不同的情景和需要,介绍四种去除字符串中多余空格的方法,
1.去除字符串首尾的空格去除首位字符串的方法很简单,只需用 strip() 这个函数即可。
quote = " 大河再汹涌,也没有我的情深壮阔。 "
clean_quote = quote.strip()
print(clean_quote)
# 大河再汹涌,也没有我的情深壮阔。
使用strip()函数去除首尾的空格就是这么简单。不过需要注意的是:字符串是不可变的。quote 这个值是不变的,我们需要将结果赋值到新字符串去访问。
strip() 函数还有两个孪生兄弟:
lstrip(): 只去除字符串左边的空格
rstrip(): 只去除字符串结尾处的空格
2.去除字符串中所有的空格去除字符串中所有的空格,相当于去除字符串中所有的空字符,可以使用 replace(), 例如:
words = " 在 我耳 边说 出 那句 话 的人,再 也 没 出 现 过 "
clean_words = words.replace(' ', '')
print(clean_words)
# 在我耳边说出那句话的人,再也没出现过
3. 去除字符串中多余的空格有时候我们需要去除多余的空格,而不是一股脑的全都去除,针对这种情况我们需要两个函数来配合完成这个任务:
split(): 根据分隔符将字符分割成 list (默认分隔符是空格)
join(): 使用分隔符将列表中的所有项目组合成一个字符串
quote = " 不 是因 为 他不在 了 "
new_quote = ' '.join(quote.split())
print(new_quote)
# 不 是 因 为 他 不 在 了
4.使用正则去除你想去掉的空格 前面三种方法也已经可以处理大部分问题,不过事情有事又是很复杂地,前几种方法处理不了的时候,就需要使用我们的终极武器–正则表达式(RegEx)
例如,如果我们只去除字符串中两个连续的空格,用前面的几个方法就比较难处理,这是使用正则就比较简单:
import re
quote = " 而是 我只 梦见过 他 一次"
new_quote = re.sub(r"\s{2}", "", quote)
print(new_quote)
# 而是 我只梦见过 他 一次
总结 去除字符串的空格,是作为Pythoner的基本操作,有些简单的情况内置函数就可以解决,对于复杂一些的情况,就需要正则表达式这个终极武器。