网站首页 > java教程 正文
需求
最近工作中碰到一个需求:我们的数据表有多个维度,任意多个维度组合后进行 group by 可能会产生一些”奇妙”的反应,由于不确定怎么组合,就需要将所有的组合都列出来进行尝试。
抽象一下就是从一个集合中取出任意元素,形成唯一的组合。如 [a,b,c] 可组合为 [a]、[b]、[c]、[ab]、[bc]、[ac]、[abc]。
要求如下:
- 组合内的元素数大于 0 小于等于 数组大小;
- 组合内不能有重复元素,如 [aab] 是不符合要求的组合;
- 组合内元素的位置随意,即 [ab] 和 [ba] 视为同一种组合; 看到这里,就应该想到高中所学习的排列组合了,同样是从集合中取出元素形成一个另一个集合,如果集合内元素位置随意,就是组合,从 b 个元素中取 a 个元素的组合有 种。而如果要求元素顺序不同也视为不同集合的话,就是排列,从 m 个元素取 n 个元素的排列有 种。
我遇到的这个需求就是典型的组合,用公式来表示就是从元素个数为 n 的集合中列出 种组合。
文中算法用Java实现。
从排列到组合-穷举
对于这种需求,首先想到的当然是穷举。由于排列的要求较少,实现更简单一些,如果我先找出所有排列,再剔除由于位置不同而重复的元素,即可实现需求。假设需要从 [A B C D E] 五个元素中取出所有组合,那么我们先找出所有元素的全排列,然后再将类似 [A B] 和 [B A] 两种集合去重即可。
我们又知道 ,那么我们先考虑一种情况 ,假设是 ,从 5 个元素中选出三个进行全排列。
被选取的三个元素,每一个都可以是 ABCDE 之一,然后再排除掉形成的集合中有重复元素的,就是 5 选 3 的全排列了。
代码是这样:
private static Set < Set < String >> exhaustion() { List < String > m = Arrays .asList( "a" , "b" , "c" , "d" , "e" ); Set < Set < String >> result = new HashSet <>(); int count = 3 ; for ( int a = 1 ; a < m.size(); a++) { for ( int b = 0 ; b < m.size(); b++) { for ( int c = 0 ; c < m.size(); c++) { Set < String > tempCollection = new HashSet <>(); tempCollection.add(m. get (a)); tempCollection.add(m. get (b)); tempCollection.add(m. get (c)); if (tempCollection.size() == count) { result.add(tempCollection); } } } } return result; }
对于结果组合的排重,我借用了 Java 中 HashSet 的两个特性:
元素唯一性,选取三个元素放到 Set 内,重复的会被过滤掉,那么就可以通过集合的大小来判断是否有重复元素了,
元素无序性,Set[A B] 和 Set[B A] 都会被表示成 Set[A B]。另外又由于元素唯一性,被同时表示为 Set[A B] 的多个集合只会保留一个,这样就可以帮助将全排列转为组合。可以注意得到,上面程序中 count 参数是写死的,如果需要取出 4 个元素的话就需要四层循环嵌套了,如果取的元素个取是可变的话,普通的编码方式就不适合了。
注: 可变层数的循环可以用 递归 来实现。
从排列到组合-分治
穷举毕竟太过暴力,我们来通过分治思想来重新考虑一下这个问题:
分治思想
分治的思想总的来说就是”大事化小,小事化了”,它将复杂的问题往简单划分,直到划分为可直接解决的问题,再从这个直接可以解决的问题向上聚合,最后解决问题。
从 M 个元素中取出 N 个元素整个问题很复杂,用分治思想就可以理解为:
首先,如果我们已经从 M 中元素取出了一个元素,那么集合中还剩下 M-1 个,需要取的元素就剩下 N-1 个。还不好解决的话,我们假设又从 M-1 中取出了一个元素,集合中还剩下 M-2 个,需要取的元素只剩下 N-2 个。直到我们可能取了有 M-N+1 次,需要取的元素只剩下一个了,再从剩余集合中取,就是一个简单问题了,很简单,取法有 M-N+1 种。如果我们解决了这个问题,已经取完最后一次了产生了 M-N+1 种临时集合,再考虑从 M-N+2 个元素中取一个元素呢,又有 M-N+2 种可能。将这些可能聚合到一块,直到取到了 N 个元素,这个问题也就解决了。
还是从 5 个元素中取 3 个元素的示例:
从 5 个元素中取 3 个元素是一个复杂问题,为了简化它,我们认为已经取出了一个元素,还要再从剩余的 4 个元素中取出 2 个,求解公式为:。从 4 个元素中取出 2 个依旧不易解决,那我们再假设又取出了一个元素,接下来的问题是如何从 3 个元素中取一个,公式为 。从 3 个元素中取 1 个已经是个简单问题了,有三种可能,再向上追溯,与四取一、五取一的可能性做乘,从而解决这个问题。代码实现
用代码实现如下:
public class Combination { public static void main( String [] args) { List < String > m = Arrays .asList( "a" , "b" , "c" , "d" , "e" ); int n = 5 ; Set < Set < String >> combinationAll = new HashSet <>(); for ( int c = 1 ; c <= n; c++) { combinationAll.addAll(combination(m, new ArrayList <>(), c)); } System . out .println(combinationAll); } private static Set < Set < String >> combination( List < String > remainEle, List < String > tempCollection, int fetchCount) { if (fetchCount == 1 ) { Set < Set < String >> eligibleCollections = new HashSet <>(); for ( String ele : remainEle) { Set < String > collection = new HashSet <>(tempCollection); collection.add(ele); eligibleCollections.add(collection); } return eligibleCollections; } fetchCount--; Set < Set < String >> result = new HashSet <>(); for ( int i = 0 ; i < remainEle.size(); i++) { List < String > collection = new ArrayList <>(tempCollection); List < String > tempRemain = new ArrayList <>(remainEle); collection.add(tempRemain.remove(i)); result.addAll(combination(tempRemain, collection, fetchCount)); } return result; } }
其实就是 递归。
直击本质-位运算
从元素的全排列找全组合,比穷举略好,但还不是最好的方法,毕竟它”绕了一次道”。
很多算法都能通过位运算巧秒地解决,其优势主要有两点:一者位运算在计算机中执行效率超高,再者由于位运算语义简单,算法大多直指本质。
组合算法也能通过位运算实现。
思想
再次考虑全组合的需求,从 M 个元素中取任意个元素形成组合,组合内元素不能重复、元素位置无关。
之前的方法都是从结果组合是否满足要求来考虑问题,考虑组合是否有重复元素、是否已有同样的组合等条件。如果换种思路,从待选元素上来考虑呢?
对于每个元素来说,它的状态就简单得多了,要么被放进组合,要么不放进组合。每个元素都有这么两种状态。如果从 5 个元素中任意取 N 个元素形成组合的话,用二进制位来表示每个元素是否被放到组合里,就是:
A B C D E 0 0 0 0 1 [E] = 1 A B C D E 0 0 0 1 0 [D] = 2 A B C D E 0 0 0 1 1 [DE] = 3 ...
看到这里,应该就非常清楚了吧,每种组合都可以拆解为 N 个二进制位的表达形式,而每个二进制组合同时代表着一个十进制数字,所以每个十进制数字都就能代表着一种组合。
十进制数字的数目我们很简单就能算出来,从00000... 到 11111... 一共有 种,排除掉全都不被放进组合这种可能,结果有种。
代码实现
下面是 Java 代码的实现:
public class Combination { public static void main( String [] args) { String [] m = { "A" , "B" , "C" , "D" , "E" }; Set < Set < String >> combinationAll = combination(m); System . out .println(combinationAll); } private static Set < Set < String >> combination( String [] m) { Set < Set < String >> result = new HashSet <>(); for ( int i = 1 ; i < Math .pow( 2 , m.length) - 1 ; i++) { Set < String > eligibleCollections = new HashSet <>(); for ( int j = 0 ; j < m.length; j++) { if ((i & ( int ) Math .pow( 2 , j)) == Math .pow( 2 , j)) { eligibleCollections.add(m[j]); } } result.add(eligibleCollections); } return result; } }
小结
排列和组合算法在实际应用中很常见,而且他们的实现方法也非常具有参考意义。总的来说:排列用递归、组合用位运算。
猜你喜欢
- 2024-10-18 Java 中的移位运算符(Shift Operator)
- 2024-10-18 「每日分享」把Map中的hash()分析的最透彻的文章
- 2024-10-18 从bitmap到布隆过滤器,再到高并发缓存设计策略
- 2024-10-18 Java基础入门(运算符)(java运算符的含义)
- 2024-10-18 Day03-Java运算(三年级混合运算练习题)
- 2024-10-18 浅谈java中的数学运算(java的数学公式有哪些)
- 2024-10-18 好程序员Java学习路线分享Java中的位移运算
- 2024-10-18 全网分析Map中hash方法最透彻的一篇文章
- 2024-10-18 为什么Java String哈希乘数为31?(java中string是什么数据类型)
- 2024-10-18 Java精确运算高位数数字(java计算精度问题)
你 发表评论:
欢迎- 07-15采用Oracle OSB总线进行服务注册和接入
- 07-15javaEE 新闻管理系统 oracle11+tomcat6
- 07-15从Oracle演进看数据库技术的发展(oracle数据库发展史)
- 07-15如何升级oracle数据库安全补丁(oraclepsu补丁升级)
- 07-15【权威发布】关于Oracle WebLogic Server未授权远程代码执行高危漏洞的预警通报
- 07-15【mykit-data】 数据库同步工具(数据库表同步工具)
- 07-15[Java速成] 数据库基础,Connector/J、JDBC、JPA的关系(day 7)
- 07-15Google前工程主管“入住”Oracle(google浏览器找不到以前的书签)
- 最近发表
-
- 采用Oracle OSB总线进行服务注册和接入
- javaEE 新闻管理系统 oracle11+tomcat6
- 从Oracle演进看数据库技术的发展(oracle数据库发展史)
- 如何升级oracle数据库安全补丁(oraclepsu补丁升级)
- 【权威发布】关于Oracle WebLogic Server未授权远程代码执行高危漏洞的预警通报
- 【mykit-data】 数据库同步工具(数据库表同步工具)
- [Java速成] 数据库基础,Connector/J、JDBC、JPA的关系(day 7)
- Google前工程主管“入住”Oracle(google浏览器找不到以前的书签)
- Oracle数据库云服务系列新增前所未有的企业级功能
- 直播预告丨如何实现Oracle存储过程到java的一键转化
- 标签列表
-
- java反编译工具 (77)
- java反射 (57)
- java接口 (61)
- java随机数 (63)
- java7下载 (59)
- java数据结构 (61)
- java 三目运算符 (65)
- java对象转map (63)
- Java继承 (69)
- java字符串替换 (60)
- 快速排序java (59)
- java并发编程 (58)
- java api文档 (60)
- centos安装java (57)
- java调用webservice接口 (61)
- java深拷贝 (61)
- 工厂模式java (59)
- java代理模式 (59)
- java.lang (57)
- java连接mysql数据库 (67)
- java重载 (68)
- java 循环语句 (66)
- java反序列化 (58)
- java时间函数 (60)
- java是值传递还是引用传递 (62)
本文暂时没有评论,来添加一个吧(●'◡'●)